面向使用模型者1.1 入門:AI學習路徑 1. 深度學習與神經網路原理 深度學習入門與進階 旨在提供對每個概念的理解,盡可能使用類比和圖像來提供易於理解的資訊,包括對深度學習領域的直觀概述,而非數學和理論細節 沒錯!你應該了解反向傳播 反向傳播是一種抽象漏洞,這是一個具有重要結果的信用分配方案,如果因為”TensorFlow自動讓網路學習“而是圖忽略底層運作原理,那就無法準備應對隨之而來的危險,並且在建構和調試神經網路方面的效率也會大大降低 Word2Vec詳解 詞嵌入是解決NLP中許多問題不可或缺的一部分,描述了人類如何理解機器語言,可以將它想像為文本的向量化表示。Word2Vec是一種常用生成詞的嵌入方法,具有多種應用,如文本相似性、推薦系統、情感分析等 2. Transformer原理 GPT的現狀 Karpathy撰寫,淺顯易懂的說明ChatGPT/GPT模型一般如何運作、如何使用以及研發可能採取的方向 ChatGPT在做什麼?為什麼它能夠成功? 電腦科學家和企業家Stephen Wolfram,從早期神經網路到今天LLMs和ChatGPT的時間線,從一開始的原理到現代AI模型是如何運作的,寫了一篇詳細且易讀的文章 解析Tansformer模型:理解GPT-3、BERT和T5背後的模型 Dale Markowitz撰寫,針對GPT-3但仍適用於新模型,對“什麼是LLM、是如何運作的?”有更簡潔和直接的回答,輕鬆帶入主題並對技術建立直觀的理解 3. Stable Diffusion原理 穩定擴散 (Stable Diffusion) 如何運作 對應上一篇電腦視覺領域的文章,Chris McCormick為非專業人士解釋了Stable Diffusion是如何運作的,並從文本到圖像模型的角度,幫助讀者對技術建立直觀的理解 What are Diffusion Models? 擴散模型是一種基於非平衡熱力學的生成模型,通過擴散步驟的馬爾科夫鏈逐漸向數據添加隨機噪聲,然後以從噪聲構造所需的數據樣本學習逆轉擴散過程。擴散模型與生成對抗網路 (GAN) 、變分自編碼器 (VAE) 和流模型有所不同,它們通過固定的過程進行學習,並且潛在變量具有與原始數據相同的高維度