译者:ACFUN_AK
额……老铁们,我图吧老捡废弃物的了。前段时间咱在极短时间里始终都在Jaunpur用不着写诗都在读音频了,接着辨认出前段时间的音频中文网站有些也上了YouTube同型号的AI全自动片头,那个技术咱提过18年左右当信息技术区UP的这时候就见过了,但碍于始终没方式抽取浏览,而如今咱找出了B站AI片头的抽取浏览方式,单纯给诸位说明一下。
只不过那个方式来自与B站CC片头的抽取拳法,前段时间才刚成形再次出现了新浪网辅助工具以及大量的音频讲义,之前他们在天前想搞的这时候却是没的。
总而言之他们的市场需求是彼时出的一些随笔音频有文章意见反馈说咱用的耳机录音带效用差听不太清,接着咱感觉却是有点重要的所以须要想配套措施弄了片头。
该游戏倒是只有UP能查到效用不太好就可见一斑了。
但只不过咱辨认出那个音频的观赏是能选择AI片头的,虽然很多这时候热门词汇或者读音不精确的这时候辨识效用十分的动人但最少它是整套的能改的片头,然而彼时咱看了一会结论辨认出并没什么配套措施能直接浏览那个片头,行吧。
结论前段时间再次出现了转折,就像咱这边说的一样,B站再次出现了做CC片头抽取的UP接着他们的提供的方式经过单纯改良就能抽取AI片头,对于咱此种做音频也罢写诗也罢想到哪说哪显然不打草稿的老UP十分方便快捷。咱那时是面临此种情况因为做音频是不是方便快捷是不是来显然就没工程建设文档音频一删邻近地区唯独档都没,就导致如果转头须要提及自己音频的美术设计还得全自动抽取AI辨识片头,属于是十分麻烦事的一个问题。那时那个市场需求也能解决
单纯来说抽取B站AI片头的方式是开F12接着直接关闭播放器片头点刷新或者F5,接着在开发者辅助工具里面选Network接着从Filter搜索框里面输入关键词就能找出JSON格式的CC片头
那个链接带subtitle的是
接着那个链接直接打开就能看见JSON格式的片头,能双击也能复制链接再开是不是都一样
至于AI片头只须要把关键词换成ai_subtitle就能了
接着说下那个问题,单纯来说这样的JSON片头咱是没法直接拿来就用的,因为正常的非编软件也罢片头软件也罢都是认传统的ASS SSA SRT甚至LRC之类的片头的,它们不认此种JSON格式的片头
但之前咱说什么来着,前段时间搞CC片头的UP才刚开始把这套工艺成形化,彼时咱发那个随笔音频的这时候是还没再次出现转换辅助工具的,而那时随便把JSON片头链接页面上的内容Ctrl+A全选之后再Ctrl+C+V就能导入到新浪网辅助工具里转换了,连浏览.JSON文档都不须要
这里他们能看到无论是AI聚合的JSON片头却是上传的CC片头都能直接转成标准播放器和非编软件支持的格式,如果你浏览了.JSON文档还能直接上传。
选择TXT格式的话还能出不带时间轴的纯文字,接着选择保存到邻近地区就能直接用记事本打开了
SRT格式导入播放器也能直接以外挂片头的形式存在,更改字体什么的也很容易就能做到,如果想转内嵌片头单纯修改一下AI片头中辨识错误的部分再保存接着就能直接导入非编或者压制辅助工具用软件压制了
那个校对的活能直接用记事本干也能开其他片头软件之类的
这里他们须要说明的是经过实践辨认出B站AI聚合片头抽取转换之后尝试导入AEGIS或者小丸辅助工具箱之类的可能会再次出现打不开报错卡BUG,比如时间轴上有零时长的片段或者语法错误之类的,但此种问题的解决方式也比较单纯
能先把AI聚合转换出来的片头投稿到音频
接着通过之后再抽取下来的片头转出来就基本没什么问题了,能直接塞进小丸辅助工具箱之类的进行压制,就不会再卡BUG了(然而AEGIS却是报错)
接着用小丸辅助工具箱压制的话是能直接做内嵌片头在里面的,但经过实测他们辨认出10多分钟的1080P音频也得压个最少10分钟以上,效率比较低,而且这期间还存在没标注字体的片头只使用默认字体的情况。
所以咱还有一种解决方案做片头也罢文字转语音也罢比较单纯粗暴就直接开录屏就行了,现代GPU普遍集成音频编码器能实现硬件编码音频,它用来录屏的效用只不过画质损耗相比用CPU压制不算特别大属于能接受的水平,除非你在做画质展示不然此种随笔类的肯定是没问题。
单纯来说咱是用此种方式给之前在天前的随笔音频做出来了内嵌片头音频+外挂片头更新顺带捎带手的还提供了纯文字版:
接着咱自己这边只不过就已经完活了,这期讲义能完事了。但咱本着好奇的心理尝试对隔壁UP也进行了AI片头的抽取,结论辨认出居然也能提出来:
这距离音频转文章只有一步之遥了,虽然那个音频UP做了内嵌片头接着也压根不知道AI片头的存在甚至还得是咱提醒之后才想起去关但那时那个情况就比较危了,过去他们常说文字转语音普及之后给了大量营销号洗稿的机会,一两个人上网到处扒文章出音频就能维护好几个营销号了,过去咱甚至还参加过AB站的营销号战争,当然最后的结局是战败咱就不提了,反正那时B站的所谓激励计划已经名存实亡了之前咱也预见并退了,这年景压根没法靠做音频养活人。
时过境迁那时B站都在鼓励文章一键转音频了,真是人均营销号
咱相比隔壁UP的处境只不过好很多,当年营销号战争的这时候咱心态好做音频写诗从来不强求有多火要多少曝光自己涨粉多快虽然咱也能高产但咱不整那些没用的所以最后能甘于平凡没选择自取灭亡。前段时间辨认出龙芯圈大举进攻兆芯和其他国产芯片须要测游戏体验为国产正名的这时候正好国产采集卡MS2130大量铺货,录制效用相当不错性价比直接起飞,须要把过去脱稿直接录的音频转文字就能直接扒AI片头,属于是想睡觉就来枕头。但对于一般人来说那个技术的普及可就没那么妙了。
过去他们须要做语音转文字做辨识片头须要开ARCTIMEPRO接着每天签到或者买会员才能实现普通音频长度的语音自动辨识的(前作:全全自动语音辨识聚合片头打轴软件ARCTIME使用简介),因为这玩意的语音辨识应该是新浪网辨识,并不是离线本机就能做到的。
那时他们这套操作完全不须要任何成本,相当于把语音转文字的算力市场需求托管给了音频平台。接着所有用户都能浏览和使用,属于无CD无限蓝的技能了,这东西的扩散势必引发新一轮的洗牌。就像AI画画一样,未来此种技术大范围扩展的直接结论可能导致的后果是卷死低端重复劳动只能留下精英配合AI操作,成为AI操作工+技师,未来很多搬运油管音频的片头组可能会和画师一样选择使用AI辨识+人工校对修正的方式制作片头,节省下大量的手工打轴和听译时间和人工成本。这也是他们比较期待的一个未来,所有汉化组都不须要耗费大量的时间去进行单纯重复操作直接交给软件或者说AI,只留下一些对人的智能要求比较高的工序使用人工就能实现整个流程。未来收费汉化绝对会被卷死的,收费片头组也大差不差,只有一些情况会比较常见是用AI聚合以次充好相当于卖高级机翻汉化,和那时的画师嘴上喊着反对AI实际上商业稿件使用AI最为积极是一个道理,面对实际市场需求和利益相关的这时候人往往是比较现实的。总而言之对于个人UP来说保护好自己
总而言之那个技术的风险咱已经提醒隔壁的UP了,希望他们没事或者最少心态还好。
目前来看这套操作对于B站不聚合AI片头的音频无效
当年和快音频一起脱库B站的西瓜音频如今活得害挺不错,自从巫师财经之后也算是慢慢成为主流平台了,相当于抖音的长音频平台。它们对AI片头的聚合门槛就比较高反正咱自己的音频须要AI片头的看了下一个没,估计还在内测阶段没大范围实用,用B站的关键词在F12里面搜索也没找出能直接用的JSON片头,估计用的是别的方案。所以目前那个讲义主要却是对B站有效,西瓜音频还有待进一步的观察估计未来被抓片头也只是时间问题毕竟只要能提供理论上就能抓。所以诸位创译者却是得尽量保护好自己。
目前好像咱知道的有AI片头开放的就这两家,AcFun那时是一步错步步错一步慢步步慢,估计快手也早已没进军长音频的信心了。那时转头看A站真是2018年什么样那时还什么样,是人越来越少了。所以说咱是衷心感谢对面在知道自己不行了之后先用无故封咱所有账号删稿的方式得罪了咱让咱离开的这时候心里没一点愧疚,不然只不过咱很多这时候可能会和隔壁的一些UP一样死守在那接着最后实在是混不下去再回B站这就很难受了。
就这样,谢谢朋友们!