羿阁 发自 凹非寺量子位 | 公众号 QbitAI
自称“
业余up主
”的AI大神李沐,刚刚搞了个造福剪辑圈的神器。
如果你还在犯愁每次剪视频都要反复听才能下手,不妨试试它:
连pr都不用打开,只需
对照字幕
就能轻松切掉空白停顿、反复重来的地方,简直分分钟出片!
而且目前已在GitHub上开源。
有网友就激动地表示太有用了!自己每次剪空白的地方都要剪好久,特别难受。
还有人说这才是真正把AI转化成了生产力。
究竟有多神奇?一起来看看。
“傻瓜”教程,简单易操作
这款神器名叫AutoCut,使用起来非常轻松好上手。
首先,AutoCut会对你的视频自动生成字幕。
从展示视频可以看出,不管是中文,还是英文单词都能被很好的识别出来。
而且贴心的是,连没讲话的空白部分也会进行标注。
接下来,你就可以对照字幕,将空白停顿、反复重读的地方进行删除,AutoCut也将自动对视频中对应的片段裁切并保存。
这一套流程下来,你甚至无需使用视频编辑软件,只需要编辑文本即可完成剪切。
就像李沐所说,对于他这种自编自导自演还要自己剪的“业余up主”,可以说非常友好了。
不过值得一提的是,李沐也表示由于每个人讲话习惯不同,讲得流利的视频的转录质量会高一些。
而且如果你对视频有更高的要求,可以把这一步当作粗剪使用,后期再进行一些微调,相信这一步也会为你节约掉很多琐碎的删除空白的时间。
大佬顺手做的AI工具
事实上,AutoCut的开发只是李沐「论文精读课」预告片中的一部分。
为了讲解OpenAI最新开源的语音识别系统Whisper,他就顺手做了这么一个剪视频小工具。
Whisper的论文显示,该模型共分为5个型号,本次AutoCut默认使用的是small版本。
李沐还提示,如果对字幕转录质量不满意,可以自己换上更大的whisper模型。
他还给出了自己在3种不同硬件上测试不同型号的结果,以供参考。
推荐阅读
1.
2.
pandas数据清洗
3
机器学习原创系列
整理 | Tina 原本硅谷的就业环境算是业界“先贤垂范”了,现在马斯克掀起的裁员行为,难说不会被其他企业效仿,从而导致整个硅谷的氛围出现变化。 11 月 7 日,一名前 Twitter 员工在怀孕六个月后被解雇,她因此扬言要起诉公司的新任首席执行官马斯克。 该员工在 Twitter 广告部门担任数据科学经理,上周五她与数千名其他员工一起被裁员了,因为马斯克对这家科技公司进行的“全面改革”。她在一系列推文中抨击了 Twitter 对此事的处理态度,指责其存在歧视,并发誓要在法庭上抗争。不过这些推文已连同她的账户一起被删除。 据 Insider 报道,在现已删除的推文中,她写道:“我的 Twitter 之旅已经结束,我在怀孕 6 个月时被解雇了。很高兴与你们所有人一起工作。我非常感谢能够领导这样一个了不起的 [数据科学] 团队,这是一段有趣的旅程。
如何更好、更快和更便宜地实现训练、微调AIGC模型 开源完整Stable Diffusion预训练和个性化微调方案,预训练时间加速和经济成本降低6.5倍,个性化微调硬件成本降低7倍!在个人电脑的RTX 2070/3050上即可快速完成微调任务流程,让Stable Diffusion等AIGC模型的触手可及。 开源地址: https://github.com/hpcaitech/ColossalAI 火爆的AIGC赛道与高昂成本 AIGC(AI-Generated Content 人工智能生成内容)是当前AI领域最热门的话题之一,尤其是伴随着Stable Diffusion、Midjourney、NovelAI、DALL-E等为代表的文本生成图像的跨模态应用涌现,AIGC更是火爆出圈,广受关注。 Stable Diffusion生成图像 由于AIGC激发了大量行业需求,它已被视为下一波AI浪潮的重要方向之一,业界广泛期望出现基于AIGC在文本、音频、图像视频、游戏、元宇宙等技术场景的新技术革命和杀手级应用。AIGC在相关场景的成功商业化落地,潜在的数万亿美元市场,更是让相关初创公司成为资本宠儿,