你说语音输出快ღ★ღ✿◈,我嫌听起来不方便ღ★ღ✿◈。你觉得语音更有感情ღ★ღ✿◈,我认为文字更一目了然ღ★ღ✿◈。立场相对ღ★ღ✿◈,对语音的态度也就不同ღ★ღ✿◈。
好在ღ★ღ✿◈,已经重塑了很多产品的 aiღ★ღ✿◈,终于也在语音工具上雕花了ღ★ღ✿◈。或许会让你觉得ღ★ღ✿◈,语音也没那么讨厌ღ★ღ✿◈。
appso 选取了几款语音转文字的工具ღ★ღ✿◈,根据 4 个不同的场景ღ★ღ✿◈,分享具体的使用体验ღ★ღ✿◈,不存在纯粹的推荐ღ★ღ✿◈,过程中有种草也有踩雷ღ★ღ✿◈。
除了处理他人的语音ღ★ღ✿◈,我们也可以用这些工具ღ★ღ✿◈,记录脑洞ღ★ღ✿◈,提高效率ღ★ღ✿◈,甚至在以前意想不到的场景ღ★ღ✿◈,打开新世界的大门ღ★ღ✿◈。
接收语音固然让人暴躁ღ★ღ✿◈,输出语音却比打字来得迅速ღ★ღ✿◈。也就是说ღ★ღ✿◈,捕捉一闪而过的脑洞ღ★ღ✿◈,语音是一种时间成本较低的方式ღ★ღ✿◈。
你不用担心停顿ღ★ღ✿◈、口语化或者逻辑混乱ღ★ღ✿◈,直接开口说你的想法ღ★ღ✿◈,ai 可以帮你自动整理内容ღ★ღ✿◈,并添加标签ღ★ღ✿◈,方便管理和查找ღ★ღ✿◈。
生成文字之后ღ★ღ✿◈,你还能通过预置的提示词ღ★ღ✿◈,将内容一键改写成代办事项ღ★ღ✿◈、小红书文案等各种风格ღ★ღ✿◈,或者再和 ai 聊聊ღ★ღ✿◈,完善你的想法ღ★ღ✿◈。
我口述了编辑的工作日常ღ★ღ✿◈,要求整理成待办事项ღ★ღ✿◈,说话的时候是想到哪就说到哪ღ★ღ✿◈,但 ai 能够按时间线整理ღ★ღ✿◈。
当我以更随意的状态ღ★ღ✿◈,输出一些小说ღ★ღ✿◈、电影的评价ღ★ღ✿◈,对比了录音可以发现ღ★ღ✿◈,ai 帮我省去了一些「哎」「嗯」之类的语气词ღ★ღ✿◈,无意义的「然后」也会被消除ღ★ღ✿◈,说错的一个词重新说一遍之后ღ★ღ✿◈,会保留下来正确的版本ღ★ღ✿◈。
有些遗憾的是ღ★ღ✿◈,免费用户体验的「点数」有限ღ★ღ✿◈,且录音无法超过 1 分钟ღ★ღ✿◈,付费(19 元每月ღ★ღ✿◈、149 元每年ღ★ღ✿◈、198 元终身)ღ★ღ✿◈,才能不限制录音时间ღ★ღ✿◈,继续使用 ai 功能ღ★ღ✿◈。
海外的语音笔记应用 voicenotesღ★ღ✿◈,和闪念贝壳的定位和功能比较像ღ★ღ✿◈:保留录音ღ★ღ✿◈、添加标签ღ★ღ✿◈、人工改正转录错误生驹惠理子ღ★ღ✿◈、ai 改写文风ღ★ღ✿◈、与 ai 交流想法ღ★ღ✿◈,但界面设计更加极简ღ★ღ✿◈。
voicenotes 国内可用ღ★ღ✿◈,app 语言为英文ღ★ღ✿◈,支持在设置里将我们的输入和转写语言改成简体中文ღ★ღ✿◈。
脑洞ღ★ღ✿◈、工作事项之外ღ★ღ✿◈,我们的生活里还存在更日常ღ★ღ✿◈、更轻量ღ★ღ✿◈、一句话就能说完的场景尊龙凯时人生就是博ღ★ღ✿◈,这时候可以试试 miley aiღ★ღ✿◈,一款主打「记录 智能体」的个人记忆 aiღ★ღ✿◈,目前只有 ios 版ღ★ღ✿◈。
它很适合用来在不方便打字的路上随手一记ღ★ღ✿◈,吃了什么ღ★ღ✿◈,花了多少钱ღ★ღ✿◈,有什么突然的灵感ღ★ღ✿◈,或者接下来要做某件事情ღ★ღ✿◈,让人类 npc 的一天井井有条ღ★ღ✿◈。
你提到开心的事情ღ★ღ✿◈,ai 可以识别出你的情绪ღ★ღ✿◈,并用对应的表情标记ღ★ღ✿◈。你说午餐花了多少钱ღ★ღ✿◈,ai 会帮你记账生驹惠理子ღ★ღ✿◈。你怕错过点外卖的时间ღ★ღ✿◈,ai 可以设置横幅提醒ღ★ღ✿◈。
甚至你想设立一个每日运动的小目标ღ★ღ✿◈,也可以通过授权苹果健康数据ღ★ღ✿◈,监督每天有没有完成ღ★ღ✿◈。比如ღ★ღ✿◈,告诉 ai 每天都要散步 2000 步ღ★ღ✿◈,周末 citywalk 实现 17800 步ღ★ღ✿◈,这一项便可以打上勾ღ★ღ✿◈。
ai 的好处便在这里ღ★ღ✿◈,碎片化的内容ღ★ღ✿◈,整理起来不像以前那么花时间了ღ★ღ✿◈,甚至像我这样不喜欢做计划的懒人也愿意试试ღ★ღ✿◈,如此日积月累ღ★ღ✿◈,形成微型日记ღ★ღ✿◈,内心还会产生成就感ღ★ღ✿◈。
不过对于免费用户来说ღ★ღ✿◈,语音识别和智能体分析额度有限ღ★ღ✿◈,尤其智能体分析ღ★ღ✿◈,很容易触顶ღ★ღ✿◈,这时候就需要「钞能力」ღ★ღ✿◈,每月 28 元或者每年 188 元订阅ღ★ღ✿◈。
更影响使用体验的是ღ★ღ✿◈,语音识别的准确性不够高ღ★ღ✿◈,虽然支持修改ღ★ღ✿◈,但会影响我们使用的初衷——ai 应该省事ღ★ღ✿◈,而非多事ღ★ღ✿◈。
说到创作ღ★ღ✿◈,我们的脑海中会浮现这样的场景ღ★ღ✿◈:正襟危坐在电脑前ღ★ღ✿◈,在键盘上敲敲打打ღ★ღ✿◈,眼睛快粘在屏幕上……
更随意ღ★ღ✿◈、更生活化的语音ღ★ღ✿◈,是否能被用于更长篇幅的创作?如果你想知道自己能不能出口成章ღ★ღ✿◈,墨问便签是个不错的开始ღ★ღ✿◈。
其中一个设计很有意思ღ★ღ✿◈,墨问便签支持实时输出ღ★ღ✿◈,你边说边能看到转录的文字ღ★ღ✿◈,而不是只能看到录音时间ღ★ღ✿◈。
但这个功能也可能是打扰我们输出的干扰项ღ★ღ✿◈,虽然会不断地自我修正ღ★ღ✿◈,但转录文字的准确性还有待提高ღ★ღ✿◈。
输出完毕ღ★ღ✿◈,按下停止键ღ★ღ✿◈,ai 会对文字润色一番ღ★ღ✿◈,包括分段ღ★ღ✿◈、修改错别字ღ★ღ✿◈、去掉因为嘴瓢重复的词等等ღ★ღ✿◈,但 ai 也不能修改所有的错误ღ★ღ✿◈,之后我们还可以进行手动修改ღ★ღ✿◈。
墨问便签将自己定位为「创作者工具」ღ★ღ✿◈,打开小程序ღ★ღ✿◈,先显现出来的是它的 sloganღ★ღ✿◈:记录即创作ღ★ღ✿◈。
平时看着电脑屏幕发呆还不觉得有什么ღ★ღ✿◈,但对着手机讲满 10 分钟ღ★ღ✿◈,还是挺有挑战性的ღ★ღ✿◈,不仅口干舌燥ღ★ღ✿◈,还有搜索枯肠ღ★ღ✿◈、无话可说的无力感ღ★ღ✿◈。
平时工作遇到必须要用语音的时候ღ★ღ✿◈,飞书妙记是我的首选ღ★ღ✿◈。无他ღ★ღ✿◈,习惯了ღ★ღ✿◈,「先进团队ღ★ღ✿◈,先用飞书」ღ★ღ✿◈,企业账号真香ღ★ღ✿◈。
几十分钟甚至几个小时的线下发布会ღ★ღ✿◈、采访ღ★ღ✿◈,我都是掏出手机ღ★ღ✿◈,用飞书 app 里的「飞书妙记」录音ღ★ღ✿◈,然后在飞书网页端处理音频ღ★ღ✿◈,导出带有时间戳的文字记录ღ★ღ✿◈。
飞书妙记也支持上传本地的音视频文件ღ★ღ✿◈,如果网不好ღ★ღ✿◈,可以用手机自带的录音工具记录ღ★ღ✿◈,再交给飞书妙记处理ღ★ღ✿◈。越基础的需求ღ★ღ✿◈,越解决得好ღ★ღ✿◈,使用体验就越丝滑ღ★ღ✿◈。
飞书之前ღ★ღ✿◈,我常用的是讯飞听见ღ★ღ✿◈,飞书有的导入音频ღ★ღ✿◈、区分说话人ღ★ღ✿◈、倍速播放ღ★ღ✿◈、搜索关键词等功能ღ★ღ✿◈,它也有ღ★ღ✿◈。
不过ღ★ღ✿◈,讯飞听见虽然录音免费ღ★ღ✿◈,但核心服务收费ღ★ღ✿◈:将音频转成文字导出ღ★ღ✿◈,需要购买录音转写包(连续包月 18 元)或者畅享包(连续包月 79 元)ღ★ღ✿◈。
讯飞听见现在还有 ai 的加成ღ★ღ✿◈,支持章节速览和问一问ღ★ღ✿◈。我让聊天机器人「小谛」总结关于「冥想」的 40 分钟采访ღ★ღ✿◈,重点抓得挺有条理ღ★ღ✿◈,对于写文章有些帮助ღ★ღ✿◈。但 ai 功能也并非免费ღ★ღ✿◈,包含在录音转写包和畅享包里ღ★ღ✿◈。
通义听悟有网页ღ★ღ✿◈、浏览器插件ღ★ღ✿◈、微信小程序ღ★ღ✿◈,更加「即用即走」ღ★ღ✿◈,每天登录自动领取 10 小时的转写时长ღ★ღ✿◈,基本相当于免费使用ღ★ღ✿◈。
通义听悟也支持本地音视频的转文字ღ★ღ✿◈,可以区分发言人ღ★ღ✿◈、提供翻译尊龙凯时人生就是博ღ★ღ✿◈,但我用得更多的ღ★ღ✿◈,是实时语音转文字的功能ღ★ღ✿◈。
在网页端生驹惠理子ღ★ღ✿◈,将标签页分享给通义听悟ღ★ღ✿◈,我们开会ღ★ღ✿◈、看视频ღ★ღ✿◈、追发布会ღ★ღ✿◈,就能拥有一个实时记录ღ★ღ✿◈、提供字幕的搭子ღ★ღ✿◈。
如果涉及外语ღ★ღ✿◈,通义听悟还支持实时双语字幕ღ★ღ✿◈,先选择音视频语言ღ★ღ✿◈,再选择翻译语言生驹惠理子ღ★ღ✿◈,然后开启实时记录即可ღ★ღ✿◈。
但通义听悟的翻译速度有延迟ღ★ღ✿◈,翻译结果也会根据原文的变化而变动ღ★ღ✿◈,这很正常ღ★ღ✿◈,英语句子较长ღ★ღ✿◈、定语较多ღ★ღ✿◈,一句话说完才能知道意思ღ★ღ✿◈,哪怕有字幕ღ★ღ✿◈,有时候仍然一头雾水ღ★ღ✿◈。
所以在我的实际体验中ღ★ღ✿◈,对于实时字幕ღ★ღ✿◈,通义听悟在中文发布会的表现比英文发布会要好ღ★ღ✿◈,像雷军这样略微不标准的普通话ღ★ღ✿◈,很适合交给通义听悟处理ღ★ღ✿◈。
讯飞听见有「小谛」ღ★ღ✿◈,通义听悟也有「小悟」ღ★ღ✿◈,你可以基于文字记录ღ★ღ✿◈,向它提出相关的问题尊龙凯时人生就是博ღ★ღ✿◈,点击回答中的时间戳ღ★ღ✿◈,还可以定位到原文内容ღ★ღ✿◈。
但还是会出现语音识别的老问题ღ★ღ✿◈:说不对名字ღ★ღ✿◈。kimi 变成了「km」ღ★ღ✿◈,秘塔变成了「蜜塔」ღ★ღ✿◈,靠用户自己分辨和修正ღ★ღ✿◈。
本质上ღ★ღ✿◈,这些更强调 ai 存在感的新兴语音转文字产品ღ★ღ✿◈,其实都在主打更智能ღ★ღ✿◈、深入的内容处理ღ★ღ✿◈,包括文字转写润色ღ★ღ✿◈、按标签和类型整理内容ღ★ღ✿◈、通过对话的方式查找和拓展内容等ღ★ღ✿◈。
长按 home 键ღ★ღ✿◈,或者耳机线控的中间按键ღ★ღ✿◈,就能开始语音输入ღ★ღ✿◈,记录你一闪而过的想法ღ★ღ✿◈,文字和录音都会保存下来ღ★ღ✿◈,你还能再编辑文本ღ★ღ✿◈。
这样基于系统的功能ღ★ღ✿◈,唤起和使用步骤更少ღ★ღ✿◈,也更符合我们的直觉ღ★ღ✿◈,不把记录搞复杂化ღ★ღ✿◈,才能真正地提高效率生驹惠理子ღ★ღ✿◈。
所以ღ★ღ✿◈,虽然现在产品井喷ღ★ღ✿◈,未来可能还是由操作系统厂商一锤定音ღ★ღ✿◈,出现 apple intelligence 这样的ღ★ღ✿◈、系统级的收编和降维打击ღ★ღ✿◈。
这话有些道理尊龙凯时人生就是博ღ★ღ✿◈,像我一位做播客的同事ღ★ღ✿◈,习惯在路上记录灵感ღ★ღ✿◈,试过很多语音转文字的工具ღ★ღ✿◈,最终大道至简ღ★ღ✿◈,给文件传输助手发语音ღ★ღ✿◈,再转文字ღ★ღ✿◈。
高端的食材ღ★ღ✿◈,往往只需要最简单的烹饪方式ღ★ღ✿◈。想法本身的奔涌最为可贵尊龙凯时人生就是博ღ★ღ✿◈,有些时候ღ★ღ✿◈,不需要什么辅助的 ai 功能ღ★ღ✿◈,我们只是想要快速把事情记录下来ღ★ღ✿◈,能够一键完成终极目标的ღ★ღ✿◈、最习以为常的方式ღ★ღ✿◈,往往才是效率最高的手段ღ★ღ✿◈。
媒体链接:http://gdmmrc.com/zunlongkaishirenshengjiushiboguanwangdenglu/244.html