Rails Rails world 2024 DHH 演讲(熟肉)

RaySong · 2024年09月30日 · 最后由 newerer 回复于 2024年10月03日 · 451 次阅读

https://b23.tv/cl8g93u

2023 那个也是我翻的,这次出货比较晚,是因为我两个项目里有一个难产了。😂
一个是用 wasm 在浏览器里压制字幕,这个没啥问题。
https://subpress.pages.dev/

另一个是白嫖 Cloudflare Worker AI,用 worker 免费的 whisper 生成字幕 qwen 翻译字幕。
结果这免费的 whisper 只能处理短音频,而且不稳定,有时候 10 分钟崩,有时候 5 分钟的音频也崩。
https://github.com/Ray-D-Song/worker-ai-subtitle
最后还是用我之前写的 Python 程序本地翻译...

果然免费的东西限制还是多...

想法不错,不过我觉得有必要明确标注出是 ai 字幕。

字幕方面问题挺多的,字幕分句有的过长了,有的断句不太合适,超出了画面区域,时间轴方面推荐一个项目 stable-ts。 模型方面 qwen1.5 7b 能力也比较有限,推荐下我用过便宜好用的 deepseek,或者 siliconflow 现在可以免费用 THUDM/glm-4-9b-chat,Qwen/Qwen2.5-7B-Instruct,Vendor-A/Qwen/Qwen2-72B-Instruct(国产芯片限时免费)等模型,效果都会好不少。

其实自己看的话 沉浸式翻译配 YouTube 自动识别字幕就挺不错的了

刚啃完生肉,作为一个 Rails 1、2 开始用,后来转投 Node.js 的大龄程序员,看到 ddh 延续 Rails 7 的大刀阔斧还是很激动的,不知道 Rails 开发者们对 one man framework 的定位怎么看?

jiting 回复

为了附带更多的上下文,所以翻译前把多个字幕块合并,翻译完成之后再用中文分词拆分。
导致的问题就是分词拆分不能做的很细,不然会在不该断的地方断掉...

现在这个其实是 3.5 turbo 16k 翻的,deepseek 没用过,倒是用过 siliconflow,这玩意频繁请求容易失败,而且看起来是短时间被 block 了,没法用。
至于为啥没标注 ai 字幕,因为标注 AI + 搬运或者熟肉之后会被阿 b 降低权重,就像这样。

RaySong 回复

上面这个实际上是我人工精校过的,但是哪怕把 AI 关键字去掉还是会受到影响,结果那些直接下载 youtube 机翻字幕的倒是没事...

dotnil 回复

one person framework

没什么看法,像极了当年的诺基亚,过气玩意罢了。

需要 登录 后方可回复, 如果你还没有账号请 注册新账号