Whisper是什么?
Whisper是OpenAI推出的自动语音识别(ASR)系统,使用从网络收集的 680,000 小时多语言和多任务监督数据进行训练。
详细介绍:https://openai.com/research/whisper
论文:https://cdn.openai.com/papers/whisper.pdf
开源代码:https://github.com/openai/whisper
使用地址:https://platform.openai.com/playground
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
数据统计
数据评估
关于Whisper-OpenAI开发的语音识别系统特别声明
本站六耳AI工具中文导航站提供的Whisper-OpenAI开发的语音识别系统都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由六耳AI工具中文导航站实际控制,在2023年 8月 1日 上午12:09收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,六耳AI工具中文导航站不承担任何责任。
相关导航
AI一键视频加字幕、字幕翻译
Flux.1 Kontext
Flux.1 Kontext Image Generator | AI-Powered Context-Aware Image Creation
谷歌趋势
谷歌趋势
大饼AI变声-一款专业的在线变声工具
Dubbing.tech 是一款专业的在线变声工具,可以帮助用户轻松改变自己的音色,适用于游戏开黑、社交直播等场景。用户可以选择不同的音色,如同换皮肤一样变换自己的音色,让声音更好听。
ElevenLabs: Free Text to Speech & AI Voice Generator
克隆各种声音。Create the most realistic speech with our AI audio in 1000s of voices and 32 languages. Pioneering research in Text to Speech and AI Voice Generation
ChainSecurity
智能合约的安全性扫描
Nano Banana Pro: Next-Gen 4K A
NanoBananaPro是一款由 Gemini3.0驱动的下一代AI图像生成器,可提供清晰的视觉效果、准确的文字渲染和专业的图表。
SOCKS5.IO海外代理
新兴IP品牌,最新IP,支持全球200+国家IP,IP种类全数量多,系统稳定
暂无评论...

