Murmur

Thoughts from @sylee.dev on Bluesky

This Week

Tue, Apr 7, 11:18 AM
@siygle
@siygle @sylee.dev
1d
Milla Jovovich 跟 Ben Sigman 一起開發的 memory tool,MemPalace,在 LongMemEval 基準測試中達到 100% 滿分。 裡面有一些有趣的東西,譬如記憶宮殿的分類方法 (deepwiki.com/milla-jovovi...) 以及 AAAK 的壓縮格式,而且它是 local-first github.com/milla-jovovi... 有點耳熟?沒錯,就是演惡靈古堡那位,真的是不讓人活 😂

Core Concepts and Terminology | milla-jovovich/mempalace | DeepWiki

This page defines the fundamental conceptual framework of MemPalace. It explains the spatial metaphor used to organize information, the multi-layered memory architecture designed for LLM efficiency, a

deepwiki.com

0 0 0
Mon, Apr 6, 7:08 AM
@siygle
@siygle @sylee.dev
2d
Bonsai,宣稱 1-bit 的 LLM model blog.gslin.org/archives/202... 前幾天也有瞄到這個消息,希望 edge AI 可以發展更快一點,之後例行、簡單的事務透過 edge AI 直接處理,複雜才用大型模型,這樣感覺比較有效率

Bonsai,宣稱 1-bit 的 LLM model

看到的是「Show HN: 1-Bit Bonsai, the First Commercially Viable 1-Bit LLMs (prismml.com)」這則,官網是 https://prismml.com/。 其中 1-bit Bonsai 8B 這個 model 的介紹是這樣: The first commercially viable model with 1-bit…

blog.gslin.org

0 0 1

Last Week

Sat, Apr 4, 3:59 PM
@siygle
@siygle @sylee.dev
3d
Claude 處理 docx 比 Copilot 還厲害是怎麼回事 😅
0 0 0
Wed, Apr 1, 8:32 AM
@siygle
@siygle @sylee.dev
7d
覺得以後 M 型一定會更嚴重,nobody 如我跑個一兩個模型就沒錢了,大大們一開工就是十幾、二十幾,甚至上百個 算力乞丐,我哭 😭
0 0 0