這裡記錄每週值得分享的科技內容,週五釋出。
封面圖
世界最長的高速公路隧道“天山勝利隧道”本週貫通,長達22.13公里,汽車要在裡面開20分鐘。它連線了被天山隔斷的南疆和北疆。(via[6])
西蒙·威利森的年終總結,梁文鋒的訪談
英國程式設計師西蒙·威利森(Simon Willison)最近兩年非常出名,他的個人網站[7]有很多文章,介紹 AI 的最新進展。
本週,他發表了很長一篇的2024年大模型回顧[8](非官方的中譯[9]),非常精彩。
他提到,AI 的發展速度快得難以想象。
一年前的2023年底,排名第一的 AI 模型是 OpenAI 公司的 GPT-4,沒有其他模型能超過它。
一年過去了,大家猜猜,GPT-4 現在排名[10]多少?
答案是第69位(上圖),已經有18家公司的大模型超過了它。其中的一些模型,甚至可以在筆記型電腦執行。
短短一年,榜首模型就被大量競爭者輕鬆超過,家用硬體就能達到它的執行效果。AI 的進化速度就是這麼驚人。
西蒙·威利森特別提到了來自中國的大模型 DeepSeek V3[11]。
DeepSeek V3 是2024年12月25日釋出的,來自杭州的量化基金公司幻方量化。一經發布,它就引起了國際範圍的轟動。
它在多個引數上,擊敗[12]了 OpenAI 公司最新的 o1 模型。目前,它在大模型排行榜上排名第7,要知道前十名裡面,只有它是開源模型[13],而且是最少限制的 MIT 許可證,其他都是大公司的專有模型。
而且,它的執行效率很高,訓練成本估計只有 Meta 公司的 Llama 3.1 405B 模型的11分之一,而後者的效果還不如它。這就是說,DeepSeek 找到了高效使用硬體、提高模型效果的方法。
西蒙·威利斯說:“DeepSeek V3 的訓練成本不足600萬美元,是一個極好的跡象,表明 AI 模型的訓練成本可以而且應該會繼續下降。”
西方媒體就非常好奇,DeepSeek 是怎麼做到的?
幻方量化創始人梁文鋒,跟其他 AI 模型的研究者不同,沒有海外經歷,畢業於浙江大學電子工程系人工智慧方向。
西方媒體對他充滿了好奇,專門將他以前的訪談譯成了英文[14]。
我覺得,原始的中文訪談(
Part 1,
Part 2)很值得一讀,我分享他說的幾段話,展示了中國頂級研究者的視野和抱負。
(1)我們要做的不是生成式 AI,而是通用人工智慧 AGI。前者只是後者的必經之路,AGI 會在我們有生之年實現。
(2)任何 AI 公司(短期內)都沒有碾壓對手的技術優勢,因為有 OpenAI 指路,又都基於公開論文和程式碼,大廠和創業公司都會做出自己的大語言模型。
(3)在顛覆性的技術面前,閉源形成的護城河是短暫的。即使 OpenAI 閉源,也無法阻止被別人趕超。我們把價值沉澱在團隊上,我們的同事在這個過程中得到成長,積累很多know-how,形成可以創新的組織和文化,就是我們的護城河。
(4)我們不會閉源。我們認為先有一個強大的技術生態更重要。
(5)當前階段是技術創新的爆發期,而不是應用的爆發期。大模型應用門檻會越來越低,創業公司在未來20年任何時候下場,也都有機會。
(6)過去很多年,很多的中國公司習慣了別人做技術創新,拿過來做應用變現,自己等著摩爾定律從天而降,躺在家裡18個月就會出來更好的硬體和軟體。我們的出發點,就不是趁機賺一筆,而是走到技術的前沿,去推動整個生態發展。中國也要逐步成為貢獻者,而不是一直搭便車。
(7)大部分中國公司習慣 follow,而不是創新。中國創新缺的不是資本,而是缺乏信心以及不知道怎麼組織高密度的人才。我們沒有海外回來的人,都是本土的。前50名頂尖人才可能不在中國,但也許我們能自己打造這樣的人。
(8)我們每個人對於卡和人的調動是不設上限的。如果有想法,每個人隨時可以呼叫訓練叢集的卡無需審批。同時因為不存在層級和跨部門,也可以靈活呼叫所有人,只要對方也有興趣。
(9)我們選人的標準一直都是熱愛和好奇心,所以很多人會有一些奇特的經歷,很有意思。很多人對做研究的渴望,遠超對錢的在意。
(10)我們在做最難的事。對頂級人才吸引最大的,肯定是去解決世界上最難的問題。其實,頂尖人才在中國是被低估的。因為整個社會層面的硬核創新太少了,使得他們沒有機會被識別出來。我們在做最難的事,對他們就是有吸引力的。
(11)中國產業結構的調整,會更依賴硬核技術的創新。很多人發現過去賺快錢很可能來自時代運氣,現在賺不到了,就會更願意俯身去做真正的創新。
(12)我是八十年代在廣東一個五線城市長大的。我的父親是小學老師,九十年代,廣東賺錢機會很多,當時有不少家長覺得讀書沒用。但現在回去看,觀念都變了。因為錢不好賺了,連開出租車的機會可能都沒了。一代人的時間就變了。以後硬核創新會越來越多,因為整個社會群體需要被事實教育。當這個社會讓硬核創新的人功成名就,群體性想法就會改變。我們只是還需要一堆事實和一個過程。
科技動態
1、AirTag 充電盒[15]
蘋果公司的 AirTag 可以追蹤物品,但如果沒電,就無法追蹤了。
一位國外程式設計師就遇到了這個問題。他的1萬美元裝備的相機包放在車後座被偷了,當他開啟追蹤時,才發現裡面的 AirTag 忘了換電池,已經無法追蹤了。
他痛定思痛,發明了一個 AirTag 充電盒,把兩節五號電池跟 AirTag 封裝在一起,為後者充電。
據他說,這個充電盒可以持續工作10年,完全不用擔心沒電。
只要把這個小盒子跟你要追蹤的物品,放在一起,就不用管它了,一直可以追蹤。
2、無護照過海關[16]
從2024年9月30日開始,新加坡公民透過樟宜機場出入境,不再需要護照了。
機場會使用人臉識別和虹膜識別,來代替護照。這樣更省時、成本更低。
紙製護照已經過時了,也許不久將來就會消失。
3、世界最大 3D 列印社群[17]
美國得克薩斯州即將完工世界最大的 3D 列印社群,共有100幢住宅。
這些房子都是一個巨大的 3D 印表機生成的。
房屋的列印材料是混凝土粉末、水、沙子、新增劑的混合物,噴嘴將混合物像牙膏一樣擠出,沿著預先程式設計的路徑層層堆疊,形成牆壁。
建築公司表示,3D 列印房屋更快、更便宜,現場只需要一個操作員,並且最大限度地減少了建築材料浪費。
單層的三居室或四居室住宅,大約需要三週才能列印好所有牆壁,然後再用傳統方式加固地基和安裝屋頂。
4、其他
(1)網友發現,Spotify[18] 歌單裡面,有些音樂家根本不存在,他們的作品很可能是 AI 生成的,Spotify 以此減少付出的版權費。
(2)百度推出“Ai 搜[19]”,彙集了各種 AI 相關功能。
文章
1、2024年 Linux 發行版推薦[20](英文)
作者介紹他心目中,各種用途最佳的 Linux 發行版。
2、中美工作感想[21](中文)
“過去四年五個月,我隨著工作從 SF 搬到北京,再搬到上海,後來搬回美國在洛杉磯住了一年半。”本文是國內做工程師和美國做工程師的對比。(@wukan[22] 投稿)
3、開發者應該知道的10個終端命令[23](英文)
本文簡單介紹10個終端命令,比如 grep、awk、sed、find 等。
4、Meta 四次面試經歷[24](中文)
“這些年,我一共面試了四次 Facebook/Meta。雖然都未成功,但收穫頗多。”(@DoctorLai[25] 投稿)
5、演算法面試心得[26](中文)
本文是作者對如何應付一般的演算法面試的知識總結和心得。(@javayhu[27] 投稿)
6、我們用 React 取代了 Next.js[28](英文)
作者難以忍受 Next.js 的龐雜和效能,改為直接使用 React,不再用基於它的框架了。
7、Windows 的增強剪貼簿[29](英文)
我很少用 Windows,現在才知道它的剪貼簿有同步功能,還能永久儲存。
工具
1、Ghostty[30]
一個終端模擬器,使用 GPU 渲染 UI,支援 mac 和 Linux。作者是 HashiCorp 公司創始人,參見介紹文章[31]。
2、Black Candy[32]
一個自搭建的音樂流媒體伺服器,自帶手機和 Web 客戶端,相當於自己的雲音樂平臺。
3、curl-impersonate[33]
一個 curl 的改寫版,使其發出的 HTTP 請求就像 Chrome/Firefox 發出的。
4、RSS.Beauty[34]
將普通的 RSS/Atom 訂閱源轉換成美觀的閱讀介面,程式碼開源[35]。(@ccbikai[36] 投稿)
5、AI Shadcn 主題生成器[37]
輸入關鍵詞,就可以免費生成 Shadcn 主題。(@meetqy[38] 投稿)
6、懶貓書籤[39]
開源的 Chrome 外掛,一鍵清理失效連結和空資料夾。(@Alanrk[40] 投稿)
類似外掛還有 Bookmark Pro[41]。(@wincatcher[42] 投稿)
7、Nping[43]
Rust 語言開發的 Ping 工具,支援多個地址併發 Ping,並附帶即時折線圖展示。(@hanshuaikang[44] 投稿)
8、peepDB[45]
一個命令列工具,連線各種主流的關係型資料庫,查看錶內容。
9、File Pilot[46]
非官方的 Windows 檔案管理器,號稱可以取代官方的資源管理器。
10、Doggo[47]
一個易用的 DNS 命令列查詢工具。
它的官網首頁[48]還提供 DNS 線上查詢。
AI 相關
1、DeepSeek Coder[49]
根據提示生成 App,基於 DeepSeek V3 模型。(@sing1ee[50] 投稿)
2、GodView[51]
語義化地圖,用自然語言查詢地圖,比如輸入“請展示上海的前10大圖書館”。
3、對話 CEO[52]
與馬斯克、張一鳴、任正非對話,效果還可以。(@5A59[53] 投稿)
4、ithy[54]
AI 模型聚合網站,輸入關鍵詞,同時返回 Lllma 3.1、o1-mini、Sonnet 3.5、Grok 2、Gemini 1.5 pro 的生成結果。
5、AutoMouser[55]
開源的 Chrome 瀏覽器外掛,將滑鼠操作透過 AI 轉為 Selenium Python 指令碼,需要 OpenAI key。(@guoriyue[56] 投稿)
資源
1、search the arXiv[57]
arXiv 論文庫的搜素引擎,使用自然語言搜尋。
2、《演算法(第4版)》的 C++ 實現[58]
這個倉庫包含《演算法(第4版)》教科書介紹的演算法的 C++ 語言實現,與原書的 Java 實現相對應,(@landerrosette[59] 投稿)
3、EmojiClick[60]
使用自然語言搜尋 Emoji 符號。(@yijianbo[61] 投稿)
4、獨立開發者工具[62]
該倉庫收集獨立開發者出海技術棧和工具。(@yaolifeng0629[63] 投稿)
圖片
1、世界最美鈔票[64]
2023年,國際鈔票協會評選當年的“世界最美鈔票”。得獎者是東加勒比中央銀行發行的2元紙幣。
這張鈔票色彩繽紛,確實非常漂亮。正面是當地板球明星,以及銀行標誌、烏龜和魚。
背面是魚、珊瑚、海龜、藍色島嶼地圖。
2、行業聖誕樹[65]
上週聖誕節,美國媒體貼出了,各行各業搭建自己聖誕樹的照片。
披薩店的外賣盒聖誕樹。
家裝店的玻璃聖誕樹。
修路隊的交通錐聖誕樹。
書店的聖誕樹。
電腦店的聖誕樹
超市的香蕉聖誕樹
文摘
1、亞馬遜河為什麼沒有橋?[66]
南美洲的亞馬遜河是世界第二長的河流,僅次於非洲的尼羅河。
但是,這條河沒有一座橋,是唯一一條沒有任何橋樑的世界主要河流。這是為什麼呢?
首先,每年的雨季,亞馬遜河都會氾濫,河流的寬度會從旱季的5公里變成50公里,就像下圖那樣,很難造橋。
其次,亞馬遜河沿岸人煙稀少,只有很少幾個城鎮。最大一個城市的人口只有50萬,不存在前往河對岸的強烈需求。
最後,亞馬遜河兩岸都是原始森林,並沒有現成道路。如果造橋就需要砍伐大量森林,修建引橋和公路,環境代價很大。近年來,環保意識逐漸高漲,反對造橋的呼聲也就越來越大。
言論
1、
由於 AI 的出現,英語正在成為最熱門的新程式語言。
— Andrej Karpathy[67],著名的 AI 科學家
2、
除非手機可以當成電腦使用,否則我不打算再為效能升級手機了,不再為越來越快的 CPU 買單了。
— Android Authority 專欄作家[68]
3、
保護海底光纜不出事是不可能的,你唯一能做的就是建立大量冗餘,在不同位置鋪設數十根光纜可能比保護它們更便宜。
— Hacker News 讀者[69]
4、
強大的工程師不在於速度快或產出高,而在於能夠完成其他工程師無法完成的任務。弱小的工程師幾乎任何任務都完成不了。
如果你和一個弱小的工程師一起工作,你可以幫他,但一定要保護好你的時間,防止他把你的時間都消耗光。
— 《強大的工程師與弱小的工程師》[70]
5、
人工智慧並不是釋放我們的想象力,而是外包它們。
— 英國《衛報》[71]
往年回顧
(完)
References
[1]
開源:
https://github.com/ruanyf/weekly
[2]
投稿:
https://github.com/ruanyf/weekly/issues
[3]
《誰在招人》:
https://github.com/ruanyf/weekly/issues/5830
[4]
郵件聯絡:
mailto:[email protected]
[5]
mailto:[email protected]
[6]
via:
http://news.cjn.cn/bsy/gnxw_19788/202412/t5064119.htm
[7]
他的個人網站:
https://simonwillison.net
[8]
2024年大模型回顧:
https://simonwillison.net/2024/Dec/31/llms-in-2024/
[9]
中譯:
https://www.163.com/dy/article/JKTHVG4C0511AQHO.html
[10]
排名:
https://lmarena.ai/?leaderboard
[11]
DeepSeek V3:
https://api-docs.deepseek.com/zh-cn/news/news1226
[12]
擊敗:
https://api-docs.deepseek.com/news/news1120
[13]
開源模型:
https://github.com/deepseek-ai/DeepSeek-V3
[14]
英文:
https://www.chinatalk.media/p/deepseek-ceo-interview-with-chinas
[15]
AirTag 充電盒:
https://www.elevationlab.com/blogs/news/introducing-timecapsule
[16]
無護照過海關:
https://www.ica.gov.sg/news-and-publications/newsroom/media-release/passport-less-clearance-fully-rolled-out-at-changi-airport
[17]
世界最大 3D 列印社群:
https://www.yahoo.com/news/worlds-largest-3d-printed-neighborhood-060654029.html
[18]
Spotify:
https://www.honest-broker.com/p/the-ugly-truth-about-spotify-is-finally
[19]
Ai 搜:
https://chat.baidu.com/search
[20]
2024年 Linux 發行版推薦:
https://linuxiac.com/best-linux-distro-of-2024-there-is-no-such-thing/
[21]
中美工作感想:
https://wukan.me/?p=2649
[22]
@wukan:
https://github.com/ruanyf/weekly/issues/5805
[23]
開發者應該知道的10個終端命令:
https://www.trevorlasn.com/blog/10-essential-terminal-commands-every-developer-should-know/
[24]
Meta 四次面試經歷:
https://justyy.com/archives/67279
[25]
@DoctorLai:
https://github.com/ruanyf/weekly/issues/5816
[26]
演算法面試心得:
https://javayhu.com/2016-nian-mian-shi-zhi-nan-zhi-suan-fa-mian-shi-xin-de/
[27]
@javayhu:
https://github.com/ruanyf/weekly/issues/5836
[28]
我們用 React 取代了 Next.js:
https://www.comfydeploy.com/blog/you-dont-need-nextjs
[29]
Windows 的增強剪貼簿:
https://www.xda-developers.com/permanently-save-items-clipboard-windows-11/
[30]
Ghostty:
https://ghostty.org/docs
[31]
介紹文章:
https://linuxiac.com/ghostty-1-0-gpu-accelerated-terminal-emulator-released/
[32]
Black Candy:
https://github.com/blackcandy-org/blackcandy
[33]
curl-impersonate:
https://github.com/lexiforest/curl-impersonate
[34]
RSS.Beauty:
https://rss.beauty/
[35]
程式碼開源:
https://github.com/ccbikai/RSS.Beauty
[36]
@ccbikai:
https://github.com/ruanyf/weekly/issues/5838
[37]
AI Shadcn 主題生成器:
https://ipalettes.com/theme/shadcn
[38]
@meetqy:
https://github.com/ruanyf/weekly/issues/5817
[39]
懶貓書籤:
https://github.com/Alanrk/LazyCat-Bookmark-Cleaner
[40]
@Alanrk:
https://github.com/ruanyf/weekly/issues/5832
[41]
Bookmark Pro:
https://bookmark-remainder-and-manager-pro.exthub.top
[42]
@wincatcher:
https://github.com/ruanyf/weekly/issues/5833
[43]
Nping:
https://github.com/hanshuaikang/Nping
[44]
@hanshuaikang:
https://github.com/ruanyf/weekly/issues/5821
[45]
peepDB:
https://github.com/PeepDB-dev/peepdb
[46]
File Pilot:
https://filepilot.tech
[47]
Doggo:
https://doggo.mrkaran.dev/docs/
[48]
官網首頁:
https://doggo.mrkaran.dev/
[49]
DeepSeek Coder:
https://github.com/sing1ee/deepseekCoder
[50]
@sing1ee:
https://github.com/ruanyf/weekly/issues/5808
[51]
GodView:
https://godview.ai
[52]
對話 CEO:
https://talkto.ceo
[53]
@5A59:
https://github.com/ruanyf/weekly/issues/5819
[54]
ithy:
https://ithy.com
[55]
AutoMouser:
https://github.com/guoriyue/AutoMouser
[56]
@guoriyue:
https://github.com/ruanyf/weekly/issues/5809
[57]
search the arXiv:
https://searchthearxiv.com
[58]
《演算法(第4版)》的 C++ 實現:
https://github.com/landerrosette/algs4
[59]
@landerrosette:
https://github.com/ruanyf/weekly/issues/5814
[60]
EmojiClick:
https://emojis.click/zh
[61]
@yijianbo:
https://github.com/ruanyf/weekly/issues/5806
[62]
獨立開發者工具:
https://github.com/yaolifeng0629/Awesome-independent-tools
[63]
@yaolifeng0629:
https://github.com/ruanyf/weekly/issues/5837
[64]
世界最美鈔票:
https://www.theibns.org/joomla/index.php
[65]
行業聖誕樹:
https://www.instagram.com/p/DED6ejQyX31/
[66]
亞馬遜河為什麼沒有橋?:
https://www.cntraveler.com/story/why-the-amazon-river-cant-be-crossed-by-bridge
[67]
Andrej Karpathy:
https://addyo.substack.com/p/the-70-problem-hard-truths-about
[68]
Android Authority 專欄作家:
https://www.androidauthority.com/phone-pc-performance-3504716/
[69]
Hacker News 讀者:
https://news.ycombinator.com/item?id=42351249
[70]
《強大的工程師與弱小的工程師》:
https://www.seangoedecke.com/weak-engineers/
[71]
英國《衛報》:
https://www.theguardian.com/technology/2024/nov/16/ai-isnt-about-unleashing-our-imaginations-its-about-outsourcing-them-the-real-purpose-is-profit