Access denied, Please sign in and make sure you have proper permission.

Rails Rails world 2024 DHH 演讲(熟肉)

RaySong · September 30, 2024 · Last by newerer replied at October 03, 2024 · 636 hits

https://b23.tv/cl8g93u

2023 那个也是我翻的,这次出货比较晚,是因为我两个项目里有一个难产了。😂
一个是用 wasm 在浏览器里压制字幕,这个没啥问题。
https://subpress.pages.dev/

另一个是白嫖 Cloudflare Worker AI,用 worker 免费的 whisper 生成字幕 qwen 翻译字幕。
结果这免费的 whisper 只能处理短音频,而且不稳定,有时候 10 分钟崩,有时候 5 分钟的音频也崩。
https://github.com/Ray-D-Song/worker-ai-subtitle
最后还是用我之前写的 Python 程序本地翻译...

果然免费的东西限制还是多...

想法不错,不过我觉得有必要明确标注出是 ai 字幕。

字幕方面问题挺多的,字幕分句有的过长了,有的断句不太合适,超出了画面区域,时间轴方面推荐一个项目 stable-ts。 模型方面 qwen1.5 7b 能力也比较有限,推荐下我用过便宜好用的 deepseek,或者 siliconflow 现在可以免费用 THUDM/glm-4-9b-chat,Qwen/Qwen2.5-7B-Instruct,Vendor-A/Qwen/Qwen2-72B-Instruct(国产芯片限时免费)等模型,效果都会好不少。

其实自己看的话 沉浸式翻译配 YouTube 自动识别字幕就挺不错的了

刚啃完生肉,作为一个 Rails 1、2 开始用,后来转投 Node.js 的大龄程序员,看到 ddh 延续 Rails 7 的大刀阔斧还是很激动的,不知道 Rails 开发者们对 one man framework 的定位怎么看?

Reply to jiting

为了附带更多的上下文,所以翻译前把多个字幕块合并,翻译完成之后再用中文分词拆分。
导致的问题就是分词拆分不能做的很细,不然会在不该断的地方断掉...

现在这个其实是 3.5 turbo 16k 翻的,deepseek 没用过,倒是用过 siliconflow,这玩意频繁请求容易失败,而且看起来是短时间被 block 了,没法用。
至于为啥没标注 ai 字幕,因为标注 AI + 搬运或者熟肉之后会被阿 b 降低权重,就像这样。

Reply to RaySong

上面这个实际上是我人工精校过的,但是哪怕把 AI 关键字去掉还是会受到影响,结果那些直接下载 youtube 机翻字幕的倒是没事...

Reply to dotnil

one person framework

没什么看法,像极了当年的诺基亚,过气玩意罢了。

You need to Sign in before reply, if you don't have an account, please Sign up first.