前往
大廳
主題

大型語言模型LLM演化樹及實踐指南

這可不是鬧著玩的 | 2023-04-28 22:36:13 | 巴幣 2012 | 人氣 643

更新日期:2024/04/08

來自亞馬遜、德州農工大學、萊斯大學的學者們所研究及調查。

Paper:
Github(作者已有一段時間尚未更新):
Twitter:

LLM演化樹(因作者已有一段時間尚未更新,許多模型尚未新增上去,例如Gemini、Claude 3等):

  • 非灰色基於Transformer模型
  • 粉紅色分支純encoder(編碼器)的模型
  • 綠色分支encoder-decoder(編-解碼器)的模型
  • 藍色分支純decoder(解碼器)的模型
  • 實心:Open source,表示開源的模型,例如LLaMA(被迫)
  • 空心:Closed source,表示閉源的模型,例如ChatGPT
  • 右下的堆疊長條圖不同公司與機構的模型數量

決策流程圖:幫助使用者評估下游NLP任務該選擇LLMs還是微調模型(Fine-tuned models)
  • Y:符合條件
  • N:不符合條件
  • Y旁邊有黃色圓圈表示目前尚未有合適的模型
送禮物贊助創作者 !
0
留言

創作回應

布奇汪汪
看不懂,但是好厲害的感覺
2023-04-28 23:58:12
這可不是鬧著玩的
總結並分類了歷代的LLM發展,並且幫使用者可以針對他們的NLP應用判斷合適的模型
https://truth.bahamut.com.tw/s01/202301/ec7b15e113a021e6e5f0074446393436.GIF
2023-04-29 02:40:31
伊(熊頭模式爆發中
安安,在下想問個問題

我想做一個聊天機器人,希望他是像character.ai那種,屬於有限知識的、像真人聊天的(可以談情說愛www),而非chatGPT那類智能助理。

目前character.ai沒有api,而且我也想在local部屬,目前我手上有的也只有一張3080Ti,要跑LLM似乎很難,倒是有看過gpt4all比較好跑。

不知道大大有沒有啥建議?
2023-05-02 16:55:10

更多創作