今天技术圈有几个值得关注的新动态。

DeepSeek v4 正式发布

DeepSeek 在今天发布了 v4 版本的新模型,在 Hacker News 上获得了超过 1100 个赞的热度。这次更新带来了两个新模型:

  • deepseek-v4-flash - 快速响应版本
  • deepseek-v4-pro - 专业性能版本

值得注意的是,API 格式完全兼容 OpenAI 和 Anthropic 的接口规范,这意味着开发者可以几乎零成本地迁移现有应用。只需要修改 base_urlapi_key 即可:

# OpenAI SDK 格式
base_url: https://api.deepseek.com

# Anthropic SDK 格式  
base_url: https://api.deepseek.com/anthropic

另外,deepseek-chatdeepseek-reasoner 这两个旧模型名称将在 2026年7月24日被废弃,建议开发者尽快迁移到新模型名称。

Matz 发布 Spinel:Ruby AOT 原生编译器

Ruby 之父松本行弘(Matz)发布了一个令人兴奋的新项目:Spinel —— 一个将 Ruby 代码编译成独立原生可执行文件的 AOT 编译器。

Spinel 的核心特点:

  • 全程序类型推断:自动推断类型并生成优化后的 C 代码
  • 自托管:编译器后端用 Ruby 编写,并能编译自身
  • 显著性能提升:在计算密集型任务上比 CRuby 快 11.6 倍

一些亮眼的基准测试结果:

测试项目Spinelminiruby加速比
Conway 生命游戏20 ms1,733 ms86.7x
Ackermann 函数5 ms374 ms74.8x
Mandelbrot 集25 ms1,453 ms58.1x
递归 Fibonacci17 ms581 ms34.2x

使用方法很简单:

./spinel hello.rb  # 编译成 ./hello
./hello            # 直接运行原生可执行文件

对于需要部署 Ruby 应用的开发者来说,这意味着不再需要依赖 Ruby 运行时环境,单个可执行文件即可运行。

如何 LLM 工作原理:交互式可视化指南

如果你一直想了解大语言模型到底是如何工作的,这个基于 Andrej Karpathy 技术讲座的交互式可视化指南值得一读。

指南从数据收集开始讲解:

  • Common Crawl 自 2007 年开始爬取网页,已索引 27 亿个页面
  • 经过严格的过滤和去重,最终得到约 44TB 高质量文本数据
  • 这相当于约 15 万亿个 token

关键洞察:训练数据的质量和多样性对最终模型的影响,比几乎任何其他因素都重要。 垃圾进,垃圾出 —— 但在万亿 token 的规模上。

这个可视化指南把复杂的 LLM 训练流程拆解成可点击的交互步骤,非常适合作为入门学习材料。


相关链接