幫 Google 和 Meta 免費修 bug 的人,拿到了 NVIDIA 的官方合作
兩個澳洲兄弟,50 萬美金,57K Stars,1.5 億次下載——Unsloth 如何成為開源微調的事實標準,以及那個還沒被回答的融資問題。
Daniel Han 幫 Llama 修過 bug,幫 Gemma 修過,幫 Mistral、Phi 都修過,加起來超過 20 個。
沒人付他錢,他不在這些公司工作。
修這些 bug 的時候,他在雪梨,和弟弟 Michael 兩個人,剛開始寫一個叫 Unsloth 的開源微調工具。
上週 NVIDIA 在 #GTC 2026 的官方博文和活動材料裡,把 Unsloth 和 vLLM、Ollama 並列,列為 Blackwell/DGX 生態的核心微調合作方。Nemotron 3 Nano 的微調文檔,直接指向 Unsloth。
一個幫別人免費修模型的人,讓模型廠商反過來官方推薦他的工具。
他在 NVIDIA 的時候,把 t-SNE 演算法加速了 2000 倍。維護的開源庫 HyperLearn 被 NASA 和 Microsoft 用在生產環境。
NVIDIA 給了他終身 offer,他沒接。
2021 年底跟弟弟第一次申請 YC,項目叫 Moonshot (不是Kimi那家)—— 用 ML 做世界模擬系統,他們被拒了。YC 說:先把你手上的開源工具賣出去,再來做大夢想。
他聽了一半。
2023 年底啟動 Unsloth,但他沒有「賣」,而是做了一個微調加速庫,免費送了出去。
Unsloth 直接寫 CUDA 和 Triton kernel,在算子層面對微調做優化。不是在 PyTorch 上面包一層 —— 是鑽進 GPU 指令集重寫計算邏輯。微調速度提升 2 倍,顯存降低 70%,獨立基準測試驗證過。
真正的壁壘是覆蓋面,支援超過 500 種模型架構。
Llama 出新版,Unsloth 適配。
Gemma 出新版,適配。
Qwen、Mistral、Phi、DeepSeek,全部適配。每次上游發新模型,Unsloth 都是最先能用的微調工具之一。
這不是一個「某個模型跑得快」的工具,是嵌入了整個開源模型生態的基礎層。
57,000 個 GitHub Star,HuggingFace 累計超過 1.5 億次下載。
搜「how to fine-tune Llama」,前面的教程大概率在用 Unsloth。大學課程在用,Coursera 在用,企業做微調 POC 在用。合作方包括 Google、OpenAI、Meta、NVIDIA,使用方包括 Canva 和 NASA。
然後你看融資:約 50 萬美金(Redpoint Ventures scout 和 Samsung NEXT)
57K stars、1.5 億下載、NVIDIA 官方生態夥伴,但總融資比大部分 pre-seed 還少。這要嘛是我見過最極端的資本效率,要嘛是盡調時必須回答的問題。
2025 年 2 月他在 X 上發了招聘帖:5 道題,47 分以上直接給 50 萬美金年薪加股權,不要學歷不要 PhD。130 萬次瀏覽。一家只融了 50 萬的兩人公司,給第三個員工開的薪資比大部分 Series B 都高。
我在本週用 Scorecard 篩選到 Unsloth ,跑完五個維度:8.10/10 Yellow(強),index 裡目前最高分,距離 Green 只差 0.4。(完整案例庫)
生態 A: 8.5 | 團隊 B: 7.5 | 技術 C: 8.0 | PMF D: 8.5 | 退出 E: 7.5
上一個被評估的項目(LMCache,7.78),CEO 看到報告直接轉推了並在Linkedin上回復感謝,開源評估的信號穿透力比想像中直接。
YC 當年跟 Daniel Han 說:先賣你的工具。
他沒賣,送了出去,1.5 億次。然後 NVIDIA 在自己最大的年度活動上,把他的工具放進了官方生態。
一個兩人公司,50 萬美金,已經是事實標準 —— AI Running下的AI-Native 公司?!
---------------------------------------
⭕️ 我歷經兩次創業成功退出,目前擔任新加坡風險投資機構入駐企業家(E.I.R)。我正身處中美 AI 科技一線,親歷時代賦予的這一段波瀾壯闊,十五年產品商業化戰略和資本運作經驗,深度關注全球華人科技創業,歡迎你隨時找我交流創業題目!
如果你喜歡我的文章; 歡迎在評論區訂閱我的 Substack 頻道查閱過往我撰寫的內容!



