Whisper 是一種通用的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進(jìn)行訓(xùn)練,也是一個(gè)多任務(wù)模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。
Whisper 是Openai 開源音頻轉(zhuǎn)文字的語音識別模型。它在不同音頻的大型數(shù)據(jù)集上進(jìn)行訓(xùn)練,也是一個(gè)多任務(wù)模型,可以執(zhí)行多語言語音識別以及語音翻譯和語言識別。
Whisper有五種模型尺寸,提供速度和準(zhǔn)確性的平衡,其中English-only模型提供了四種選擇。下面是可用模型的名稱、大致內(nèi)存需求和相對速度。
AI Companion App
AIdea
一個(gè)面向AI開發(fā)者,創(chuàng)業(yè)者設(shè)計(jì)的開源AI應(yīng)用框架,它幾分鐘就能部...
一個(gè)可以一鍵生成爆款視頻的商業(yè)級自動(dòng)化工具,能自動(dòng)完成從寫文案到...
MiroMind團(tuán)隊(duì)公開的一個(gè)高性能多Agent框架。它讓各種大...
一款開源的 Web 音樂標(biāo)簽編輯器,能直接編輯服務(wù)器或本機(jī)上的音...
一個(gè)專門用來畫城市道路網(wǎng)的免費(fèi)開源工具。它用 OpenStree...
一款免費(fèi)開源+可自托管的股票市場數(shù)據(jù)平臺,可以看作昂貴商業(yè)平臺的...
一個(gè)開源的macOS原生應(yīng)用,主要做的是不用手動(dòng)操作,也能知道你...
收集了很多好的關(guān)于從零開始重新創(chuàng)建各種技術(shù)的詳細(xì)、分步指南教程,...
一個(gè)以輕量、易部署為目標(biāo)的熱點(diǎn)助手工具,幫助用戶告別信息過載,通...
捕風(fēng)記錄儀,一款開源的屏幕錄制與檢索工具,它記錄屏幕內(nèi)容來實(shí)現(xiàn)記...