DeepSeek v4 发布、Ruby AOT 编译器 Spinel、LLM 可视化指南
今天技术圈有几个值得关注的新动态。
DeepSeek v4 正式发布
DeepSeek 在今天发布了 v4 版本的新模型,在 Hacker News 上获得了超过 1100 个赞的热度。这次更新带来了两个新模型:
- deepseek-v4-flash - 快速响应版本
- deepseek-v4-pro - 专业性能版本
值得注意的是,API 格式完全兼容 OpenAI 和 Anthropic 的接口规范,这意味着开发者可以几乎零成本地迁移现有应用。只需要修改 base_url 和 api_key 即可:
# OpenAI SDK 格式
base_url: https://api.deepseek.com
# Anthropic SDK 格式
base_url: https://api.deepseek.com/anthropic
另外,deepseek-chat 和 deepseek-reasoner 这两个旧模型名称将在 2026年7月24日被废弃,建议开发者尽快迁移到新模型名称。
Matz 发布 Spinel:Ruby AOT 原生编译器
Ruby 之父松本行弘(Matz)发布了一个令人兴奋的新项目:Spinel —— 一个将 Ruby 代码编译成独立原生可执行文件的 AOT 编译器。
Spinel 的核心特点:
- 全程序类型推断:自动推断类型并生成优化后的 C 代码
- 自托管:编译器后端用 Ruby 编写,并能编译自身
- 显著性能提升:在计算密集型任务上比 CRuby 快 11.6 倍
一些亮眼的基准测试结果:
| 测试项目 | Spinel | miniruby | 加速比 |
|---|---|---|---|
| Conway 生命游戏 | 20 ms | 1,733 ms | 86.7x |
| Ackermann 函数 | 5 ms | 374 ms | 74.8x |
| Mandelbrot 集 | 25 ms | 1,453 ms | 58.1x |
| 递归 Fibonacci | 17 ms | 581 ms | 34.2x |
使用方法很简单:
./spinel hello.rb # 编译成 ./hello
./hello # 直接运行原生可执行文件
对于需要部署 Ruby 应用的开发者来说,这意味着不再需要依赖 Ruby 运行时环境,单个可执行文件即可运行。
如何 LLM 工作原理:交互式可视化指南
如果你一直想了解大语言模型到底是如何工作的,这个基于 Andrej Karpathy 技术讲座的交互式可视化指南值得一读。
指南从数据收集开始讲解:
- Common Crawl 自 2007 年开始爬取网页,已索引 27 亿个页面
- 经过严格的过滤和去重,最终得到约 44TB 高质量文本数据
- 这相当于约 15 万亿个 token
关键洞察:训练数据的质量和多样性对最终模型的影响,比几乎任何其他因素都重要。 垃圾进,垃圾出 —— 但在万亿 token 的规模上。
这个可视化指南把复杂的 LLM 训练流程拆解成可点击的交互步骤,非常适合作为入门学习材料。