James Huang Analysis of Leading Large Language Models (LLMs) in 2025 With the recent release of Grok 3, an updated, albeit subjective, ranking of mainstream Large Language Models (LLMs) is warranted. This analysis evaluates several key aspects, including free and paid ... #Acceleratedigitality AI Ai Adoption In Businesses Artificial Intelligence
James Huang 解讀模型參數 跟進較早前關於 AI 如何運作 .曾經在 AI 模型參數的世界中感到迷失嗎? 別擔心,您並不孤單!我用一個簡單的餐廳比喻來分解這些複雜的概念。 將模型參數想像成菜單項目,浮點精確度想像成廚師的刀工,而量化則想像成食材壓縮。 我們經常聽到不同的模型參數,例如 Mistral 8x7B、Llama 70B、GPT-3 175B 和 DeepSeek 671B。 一般而言,較大的參數代表更強大的模型。但... #Ai AI Ai Adoption In Businesses Artificial Intelligence How AI works
James Huang 超級圖書館員的一天 在 上一章 我們探索了神奇的圖書館,並認識了它的主要組成部分:圖書館員(自我注意)、寬敞的閱讀室(編碼器)和靈活的創作區(解碼器)。讓我們深入圖書管理員的日常工作,看看他們如何運用這些不可思議的工具,將簡單的句子轉化為深刻的理解。 圖書管理員的一天 讓我們跟隨圖書管理員一起處理這個句子:「貓坐在墊子上」 2.1 當一個句子進入資料庫(編碼器) 時 「叮咚」- 圖書館的門鈴響了,一張紙條滑入收件匣。... Ai Adoption In Businesses Artificial Intelligence How AI works
James Huang 談談我們最熟悉的陌生人:變形人 (The Transformer) (The "T" in GPT) 我敢打賭,對許多人而言,LLM 就像是一個神秘的黑洞,您聽過但卻無法掌握。今天,我會用簡單的詞彙來解釋 LLM(大型語言模型)這個關鍵概念。讓我們深入瞭解! Transformer 是 Vaswani 等人在 2017 年推出的革命性深度學習模型,其關鍵在於自我注意機制 (Self-Attention Mechanism),專門用來處理序列資料,完全改變自然語言處理 (NLP) 的遊戲規則。 將它... Ai And Design Ai And Learning Artificial Intelligence How AI works
James Huang 對 DeepSeek 的看法 總而言之,DeepSeek 對大型科技公司的威脅不大,但對一般人和知識工作者而言,卻是一項重大挑戰。 Meta 的首席 AI 科學家 Yann LeCun 如此形容 DeepSeek: 「開放原始碼社群的勝利」。 DeepSeek 冒起的必然性 為什麼我要強調 Yann LeCun 的聲明? 作為一個開源基礎模型,LLaMA不僅誕生了DeepSeek,也啟發了其他專業模型,如阿里巴巴雲的Qwen和... Ai In Business Artificial Intelligence Deepseek Job Market
James Huang 思維鏈DeepSeek 推理模型的獨特方法 本文討論了 Chain of Thought (CoT) 推理模型,重點在於 DeepSeek 相較於 GPT 等其他模型的獨特方法。 簡介 GPT O3-mini 是市場上的第四個推理模型,它的發布標誌著這一技術的日益普及。在對各種推理模型(O1、DS、Gemini 2 Flash)進行實驗後,我觀察到 DeepSeek 的 CoT 與其他模型相比有顯著的差異。例如,DeepSeek 將問題分解... #Ai Artificial Intelligence Deepseek