DeepSeek v4 发布、Ruby AOT 编译器 Spinel、LLM 可视化指南

今天技术圈有几个值得关注的新动态。

DeepSeek v4 正式发布

DeepSeek 在今天发布了 v4 版本的新模型，在 Hacker News 上获得了超过 1100 个赞的热度。这次更新带来了两个新模型：

值得注意的是，API 格式完全兼容 OpenAI 和 Anthropic 的接口规范，这意味着开发者可以几乎零成本地迁移现有应用。只需要修改 base_url 和 api_key 即可：

# OpenAI SDK 格式
base_url: https://api.deepseek.com

# Anthropic SDK 格式  
base_url: https://api.deepseek.com/anthropic

另外，deepseek-chat 和 deepseek-reasoner 这两个旧模型名称将在 2026年7月24日被废弃，建议开发者尽快迁移到新模型名称。

Ruby 之父松本行弘（Matz）发布了一个令人兴奋的新项目：Spinel —— 一个将 Ruby 代码编译成独立原生可执行文件的 AOT 编译器。

Spinel 的核心特点：

一些亮眼的基准测试结果：

测试项目	Spinel	miniruby	加速比
Conway 生命游戏	20 ms	1,733 ms	86.7x
Ackermann 函数	5 ms	374 ms	74.8x
Mandelbrot 集	25 ms	1,453 ms	58.1x
递归 Fibonacci	17 ms	581 ms	34.2x

使用方法很简单：

./spinel hello.rb  # 编译成 ./hello
./hello            # 直接运行原生可执行文件

对于需要部署 Ruby 应用的开发者来说，这意味着不再需要依赖 Ruby 运行时环境，单个可执行文件即可运行。

如果你一直想了解大语言模型到底是如何工作的，这个基于 Andrej Karpathy 技术讲座的交互式可视化指南值得一读。

指南从数据收集开始讲解：

关键洞察：训练数据的质量和多样性对最终模型的影响，比几乎任何其他因素都重要。 垃圾进，垃圾出 —— 但在万亿 token 的规模上。

这个可视化指南把复杂的 LLM 训练流程拆解成可点击的交互步骤，非常适合作为入门学习材料。