Python 原力爆擊:OpenAI / Gemini / AWS / Ollama 生成式 AI 應用新手指南
柯克(Ko Ko)、陳葵懋(Ian Chen)、Ryan Chung、陳佳新
商品描述
零框架,開啟生成式AI創新之旅!
從地端到雲端,全面佈局—解鎖生成式AI攻略
最新ChatGPT 4.1 以及O系列模型範例
必看MCP - Model Context Protocol 教學
本書特色在於以Python為核心,從地端到雲端全方位解析生成式AI的應用開發。無需依賴繁瑣的框架,解放束縛,全書直接採用各大平台(如OpenAI、Gemini、AWS、Ollama)的原生API與SDK,讓讀者從零開始逐步掌握如何實作強大且高效的AI應用。書中不僅涵蓋地端模型,更延伸至雲端模型服務與Linebot實戰,案例豐富,技術細節講解深入,為初學者和進階開發者提供了一本兼具實用性與前瞻性的指南。
【本書特色】
▶全面採用平台原生SDK,徹底解放框架的束縛
▶從單一模型到多模態模型
▶最新OpenAI Realtime API、Response API與Agent SDK
▶本書範例原始碼:https://github.com/iangithub/pythonwithai
【專業推薦】
書中每一章皆以「動手做」為核心,透過逐步拆解的程式範例、常見踩坑指南,以及商業場景的延伸思考,讓讀者不僅學會工具操作,更能掌握背後的設計哲學。無論你是想將 AI 融入日常工作流程,或是構建下一代智慧應用,這本書都會是你的「原力覺醒手冊」——從點燃第一行程式碼,到釋放生成式 AI 的爆擊能量!
張維元 / 資料科學家的工作日常 / https://portaly.cc/dsdaily
書中不僅提供了對生成式 AI 技術的清晰介紹,還通過實際案例及程式碼展示了如何在不同平台上應用這些技術。作者們以淺顯易懂的語言,將複雜的概念分解成容易理解的步驟,引導讀者從零開始,逐步掌握這些強大工具的使用方法。
在這個 AI 技術日新月異的時代,持續學習和適應新工具至關重要。通過閱讀這本書,不僅能夠學會如何使用當前最先進的生成式 AI 工具,還能建立起對相關技術的基本理解,為未來的學習和應用奠定基礎。
孫玉峰 Summit Suen
Microsoft AI MVP/AutoGPT Contributor/臺灣 R 語言社群共同主持人
作者簡介
柯克(Ko Ko)
柯克(Ko Ko)連續當選多年微軟AI領域的最有價值專家(Microsoft AI MVP),曾任職於財星世界500強企業、美國矽谷科技新創、澳洲雪梨科技新創、美國上市公司等企業,擅長於AI技術與軟體開發。他曾在 ModernWeb、.NET Conference、PyCon APAC、PyCon HK、DevDays Asia等等的國際大型年會擔任講者,也曾在四大會計、上市櫃公司、大專院校等擔任內訓講師,累計已超過萬名聽眾。他是技術社群Chatbot Developers Taiwan的核心成員,在社群裡也分享過許多自然語言處理和聊天機器人相關的實戰和心得。他熱愛向大眾分享他的經驗與所學,並且相信這樣分享的過程中能讓彼此都更進步。經營臉書粉絲專頁「大魔術熊貓工程師」。
陳葵懋(Ian Chen)
高雄師範大學資訊教育研究所碩士,目前任職於一等一科技股份有限公司,同時也是微軟AI領域的最有價值專家(Microsoft AI MVP),以及微軟國際認證講師(Microsoft MCT)。
專注於.NET、Azure雲端、生成式AI解決方案、容器化服務等技術,於Microsoft Tech days、Microsoft DevDays Asia、Modern Web Conference等大型技術研討會擔任講者。政府公務單位、大專院校與跨國上市企業AI培訓講師,同時也是高雄技術社群K.NET的聯合創辦人,經營「Semantic Kernel Developers Taiwan」臉書社團,樂於分享經驗,始終相信軟體技術應發揮影響力創造更美好的生活。
Ryan Chung
Ryan Chung,行動開發學院 MobileDev.TW創辦人,曾獲微軟人工智能大賽特別獎,目前為製造業上櫃公司AI顧問、微軟MVP Summit Pre-Day / Reactor / DevDaysAsia / .NET Conf Taiwan講師、中央大學AI學程兼任講師、元智大學資工系兼任助理教授級專業技術人員。專長於雲端生成式AI應用整合開發,使用 Azure OpenAI / Azure AI / Google Gemini AI / Amazon Bedrock AI。2022年起,獲選為微軟AI MVP 人工智慧最有價值專家。
陳佳新
彰化軟體公司奇步應用(ChiBuApp Inc.)執行長,是國際資訊大廠官方認證的LINE API Expert聊天機器人技術專家暨微軟AI MVP人工智慧最有價值技術專家,同時也是Chatbot Developers Taiwan中部分舵、GDG Changhua、彰化AMA小聚等社群活動的主辦人,經常在COSCUP、MOPCON、.NET Conf等開發者年會擔任講者,致力於提升故鄉彰化的數位化能力,立志成為地方創生最強而有力的數位轉型支持系統。
https://www.facebook.com/jarsing
目錄大綱
Chapter 1 「讓 LLM 跑進你的電腦!」Ollama 本地部署
1.1 認識大型語言模型(LLM)
1.2 使用 Ollama 部署本地 LLM
1.3 設置開發環境
1.4 關於下載與部署 LLM 模型
Chapter 2 「Ollama創作工坊!」從文本生成到 AI Agent 的實踐
2.1 Prompt 設計與推理技巧
2.2 從文字生成到視覺解讀
2.3 多輪對話(chat)互動式 AI 助手
2.4 工具與函式呼叫:擴展模型能力
2.5 RAG 檢索與生成:知識庫驅動回應
2.6 AI Agent 智能代理新時代
Chapter 3 Amazon Bedrock 大型語言模型應用基礎篇
3.1 建立 AWS(Amazon Web Service)帳號
3.2 建立LLM 開發專屬使用者
3.3 使用LLM-USER 登入
3.4 Amazon Bedrock 大型語言模型
3.5 在 Amazon Bedrock 遊樂場中使用大型語言模型 - 文字生成
3.6 在 Amazon Bedrock 遊樂場中使用大型語言模型 - 圖像生成
3.7 在 Amazon Bedrock 遊樂場中使用大型語言模型 - 影像生成
Chapter 4 Amazon Bedrock大型語言模型應用進階篇
4.1 模型提煉 Amazon Bedrock Model Distillation
4.2 開發環境設置
4.3 呼叫Amazon Bedrock 上的大型語言模型
4.4 實作:Amazon Nova Canvas 圖像生成
4.5 打造 AI Agent - 熱門歌曲排行榜查詢
Chapter 5 OpenAI魔法箱 – 揭開生成模型的核心奧秘
5.1 OpenAI 帳號申請
5.2 模型介紹與基本知識
5.3 文字生成與多模態
5.4 Embedding
5.5 Batch
5.6 畫圖
5.7 TTS 與STT
6.1 Tool Call
6.2 Structured Output
6.3 Predicted Outputs
6.4 Moderation
6.5 Realtime API
6.6 Response API
6.7 Agent SDK 與 MCP
Chapter 7 「LINE Bot × Gemini奇幻探險」搭建對話機器人的基礎藍圖
7.1 認識 Gemini 系列模型及 Google AI Studio 線上整合開發環境
7.2 認識 Vertex AI 平台及 Express 免費快速體驗模式
7.3 使用 Postwoman(Hoppscotch)串接及測試 Gemini API
7.4 認識 LINE Bot 訊息格式及使用 Flex 彈性訊息模擬器
7.5 建立 LINE 官方帳號及啟用 Messaging API
7.6 設定 LINE Bot 的 Google Colab 線上 Python 開發環境
Chapter 8 「LINE Bot × Gemini終極密訣」進階開發智慧對話的全新路徑
8.1 實戰 Gemini 程式碼執行、函式呼叫、多模態 Live API、音訊處理
8.2 實戰 Gemini 以 Google 搜尋建立基準、文件解讀、微調
8.3 實戰 Gemini 結構化輸出:生成 LINE 的 Flex 彈性訊息
8.4 實戰 LINE 接收圖片及在等待回覆時顯示載入動畫
8.5 召喚 Gemini,實作 AI 美食評論家 LINE Bot 小幫手