Gemini x NotebookLM 領軍:Nano Banana x Imagen x Veo x Gem x Gemini Live - Google 多模態 AI 工作流
洪錦魁 著
買這商品的人也買了...
-
$580$493 -
$199$157 -
$350$277 -
$550$468 -
$420$332 -
$380$323 -
$420$332 -
$799$479 -
$580$458 -
$690$414 -
$620$484 -
$580$493 -
$780$616 -
$580$435 -
$650$507 -
$680$530 -
$599$509 -
$680$537
商品描述
Gemini x NotebookLM 領軍
Nano Banana x Imagen x Veo x Gem x Gemini Live
Google 多模態 AI 工作流
本書內容
☆★☆從 Gemini 到 NotebookLM,打造個人知識與創作☆★☆
☆★☆整合 Google Workspace全系列 AI 工具☆★☆
☆★☆圖像、語音、影片與文件的多模態☆★☆
☆★☆讓 AI 真的成為你的工作夥伴,而非只會聊天的助手☆★☆
☆★☆一次搞懂「行動 + 桌面 + 雲端」的 Gemini全平台☆★☆
導讀語
在生成式 AI 快速發展的時代,Gemini 不只是聊天模型,而是能整合 Google 全生態工具的多模態中樞。從語音輸入、文件摘要、圖像生成,到 NotebookLM 的知識引擎與 Veo 的影片創作,本書完整揭示如何打造屬於你的 AI 工作流與創作引擎。
這是第一本真正整合 Gemini + Google Workspace + Imagen + Nano Banana + Veo + Storybook + Gem + NotebookLM 的中文專書。無論你是想提升效率的辦公室人士、創意工作者、行銷專家、教育工作者,或希望用 AI 展開第二職涯的自媒體創作者,這本書都會讓你擁有一位「全能的 AI 夥伴」。
本書值得閱讀的十大亮點
1. Google 全生態 AI 教學首創整合書
全面整合 Gemini、Nano Banana、Imagen、Veo、Gem、Storybook、NotebookLM、Gemini Live 等八大 AI 平台,建立多模態工作流的第一本中文專書。
2. 從聊天到研究的多層次學習路徑
第1 ~ 3章由淺入深介紹 Gemini 操作、聊天技巧與輸出格式控制,讓新手快速具備 AI 對話邏輯與結構思考力。
3. 跨應用場景的實務操作
旅遊、媒體、Workspace 三大應用章節(第4 ~ 6章),示範如何整合 Google 地圖、航班、YouTube、Gmail、Docs、Calendar 等工具,打造 AI 辦公室自動化流程。
4. 多模態資料上傳與分析實戰
第7章介紹文字、音訊、圖像三大資料型態上傳與智慧解析,展現 Gemini 在辦公與研究領域的強大應用潛力。
5. Canvas:讓 AI 思維具象化
第8章揭示 Gemini Canvas 的結構化創作方式,協助使用者將靈感轉化為資訊圖表、測驗與網頁。
6. Deep Research:AI 查證與引用透明化
第9章教你如何利用多來源比對與長時推理,生成可驗證、可追溯的研究結果,適合學生、學者與記者。
7. Gem 與 Storybook:建立專屬 AI 助理與導師
第10 ~ 12章示範如何設計具角色與任務導向的 AI 助理,並以 Storybook 進行創意與學習引導。
8. Imagen x Nano Banana x Veo:影像與影片生成三部曲
第13 ~ 15章構成全書的多媒體創作核心,從繪圖、融合、動畫到影片生成,呈現 AI 跨模態創作新時代。
9. Gemini App 與 Live:AI 隨身工作夥伴
第16章完整介紹手機端 Gemini 的語音、鏡頭、即時翻譯、視訊與直播應用,展現行動 AI 實力。
10. NotebookLM:AI 知識庫與學習革命
第17章是本書壓軸,從「資料來源 → 對話 → 工作室」完整展示 NotebookLM 的知識引擎與多模態輸出(語音摘要、影片摘要、報告、心智圖、學習卡與測驗)。
作者簡介
洪錦魁
畢業於明志工專(現今明志科技大學),跳級留學美國University of Mississippi計算機系研究所。
2023年和2024年連續2年獲選博客來10大暢銷華文作家,多年來唯一電腦書籍作者獲選,也是一位跨越電腦作業系統與科技時代的電腦專家,著作等身的作家,下列是他在各時期的代表作品。
► DOS時代:「IBM PC組合語言、Basic、C、C++、Pascal、資料結構」。
► Windows時代:「Windows Programming 使用C、Visual Basic」。
► Internet時代:「網頁設計使用HTML」。
► 大數據時代:「R 語言邁向Big Data之路、Python王者歸來」。
► AI時代:「機器學習數學、微積分 + Python實作」、「AI視覺、AI之眼」。
► 通用AI時代:「ChatGPT、Copilot、無料AI、AI職場、AI行銷、AI影片、AI賺錢術」。
► Vibe Coding 時代:「寫程式的 AI 戰友 – VS Code x GitHub Copilot」。
作品曾被翻譯為簡體中文、馬來西亞文,英文,近年來作品則是在北京清華大學和台灣深智同步發行。
他的多本著作皆曾登上天瓏、博客來、Momo電腦書類,不同時期暢銷排行榜第1 名,他的著作特色是,所有程式語法或是功能解說會依特性分類,同時以實用的程式範例做說明,不賣弄學問,讓整本書淺顯易懂,讀者可以由他的著作事半功倍輕鬆掌握相關知識。
目錄大綱
▌第1 章 認識與快速上手Gemini
1-1 Gemini 是什麼
1-2 認識不同版本的 Gemini
1-3 登入與認識Gemini( 基本版) 操作環境
1-3-1 認識聊天環境
1-3-2 展開或收合選單
1-3-3 「新的對話」與「臨時對話」
1-3-4 主題 - 介面色彩
1-3-5 2.5 Flash 版本
1-3-6 升級
1-3-7 Nano Banana
1-4 與Gemini 聊天 – 展現Google AI 的特色
1-4-1 一般聊天測試
1-4-2 回覆下方的功能圖示
1-4-3 結合「Google 地圖」的聊天測試
1-4-4 結合Google 搜尋
1-4-5 分行輸入 - Shift + Enter 鍵
1-5 生成與操作聊天主題
1-5-1 生成聊天標題
1-5-2 釘選
1-6 共用 - 分享聊天內容
1-6-1 分享聊天的應用情境
1-6-2 分享內容
1-6-3 刪除分享連結
1-7 匯出文件 - 傳送到 Word 與 Gmail
1-7-1 匯出文件到Word
1-7-2 在Gmail 建立草稿
1-8 閱讀網址內容生成摘要報告
1-8-1 閱讀Youtube 網站產生中文摘要
1-8-2 閱讀中文網站生成摘要
1-8-3 生成表格式的報告
1-9 查核Gemini 回應資料的正確性
1-10 活動紀錄
1-11 搜尋功能
1-12 已儲存的資訊
1-12-1 功能定位
1-12-2 可以儲存的內容
1-12-3 啟用已儲存資訊
1-12-4 測試已儲存資訊 - Gemini 推薦筆者適合寫作的地方
▌第2 章 語音輸入與朗讀輸出- 外語隨身教練
2-1 語音輸入與朗讀輸出
2-1-1 語音輸入的應用場景
2-1-2 Gemini 會徵求我們的同意
2-1-3 語音輸入與朗讀輸出
2-1-4 語音輸入的其他應用
2-2 學習外語的隨身教練
2-2-1 「說 → 看 → 聽」的學習教練
2-2-2 實際範例
▌第3 章 聊天技巧與輸出格式的規則
3-1 聊天技巧
3-1-1 明確化需求
3-1-2 分步驟提問
3-1-3 善用上下文與範例
3-1-4 指定角色與視角
3-1-5 持續修正與迭代
3-2 如何讓Gemini 用您指定的格式回應
3-2-1 為什麼格式控制很重要?
3-2-2 常見的格式控制方式
3-2-3 語法指令補充技巧
3-2-4 總結
3-3 條列式、Q&A、表格輸出控制
3-3-1 條列式輸出(List Format)
3-3-2 問與答格式(Q&A)
3-3-3 表格輸出(Table Format)
3-3-4 總結
3-4 限制字數與加入實例
3-4-1 限制字數(Length Limitation)
3-4-2 加入實例(Include Examples)
▌第4 章 Gemini 應用程式 – 旅遊類
4-1 認識「應用程式」
4-1-1 展開「應用程式」項目
4-1-2 輸入「@」啟用應用程式
4-2 Google 地圖 - 智慧導覽與資訊查詢
4-2-1 當地圖應用未啟用時 - Gemini 如何回答
4-2-2 地點查詢
4-2-3 路線規劃
4-2-4 附近探索
4-3 Google 航班/ 機票 - 智慧查詢與比價
4-3-1 航班查詢
4-3-2 票價比對
4-3-3 轉機資訊
4-3-4 彈性搜尋
4-4 Google 飯店 - 智慧查詢與比價
4-4-1 旅遊住宿規劃
4-4-2 價格比較
4-4-3 評價篩選
4-4-4 地點便利性
4-5 結合地圖、航班或飯店的旅遊規劃
4-5-1 Gemini 的旅遊規劃方式
4-5-2 5 天4 夜自由行
▌第5 章 Gemini 應用程式 - 媒體類
5-1 YouTube/YouTube Music 功能概覽
5-1-1 三大核心功能
5-1-2 適用情境
5-2 YouTube 應用
5-2-1 影片搜尋
5-2-2 影片摘要
5-3 YouTube Music 應用
5-3-1 歌曲搜尋
5-3-2 播放清單推薦
5-3-3 探索新音樂
▌第6 章 Gemini 應用程式 - Google Workspace
6-1 Gmail 應用 - 智慧郵件操作
6-1-1 智慧郵件摘要 - 快速擷取重點內容
6-1-2 自動回覆建議 - 撰寫更有效率
6-1-3 郵件分類與搜尋 - Gemini 輔助高精準過濾
6-2 Google Calendar - 時間管理
6-2-1 認識Chrome 視窗的Google Calendar
6-2-2 從無到有 - Gemini 協助生成行程
6-3 Google Keep - 雲端筆記
6-3-1 認識Chrome 視窗的Google Keep
6-3-2 從無到有 - Gemini 協助生成筆記
6-4 Google Tasks - 建立待辦清單系統
6-4-1 認識Chrome 視窗的Google Tasks
6-4-2 建立待辦事項
6-4-3 待辦清單轉成Calendar
6-5 Google 文件 – 生成與摘要
6-5-1 認識Chrome 視窗的Google 文件
6-5-2 Gemini 輔助快速建立草稿
6-5-3 Gemini 視窗編輯Google 文件
6-6 Google 雲端硬碟
6-6-1 認識Chrome 視窗的Google 雲端硬碟
6-6-2 摘要檔案內容
▌第7 章 文字、音訊與圖像檔案上傳 - 智慧分析
7-1 檔案上傳與分析的核心價值
7-1-1 與傳統辦公軟體的差異
7-1-2 實務操作
7-2 文件型檔案分析(Word、PDF) - 語音摘要
7-2-1 文字摘要
7-2-2 語音摘要
7-2-3 其他摘要Prompt 實例
7-3 音訊檔案轉文字稿
7-4 AI 視覺 - 上傳圖像,理解圖像內容
7-4-1 物品識別
7-4-2 場景分析
7-4-3 文字識別與抽取
7-4-4 圖像意境解讀
7-4-5 跨模態互動
▌第8 章 Gemini 的 Canvas 功能
8-1 Canvas 功能概覽
8-1-1 定位 - AI 輔助的知識與專案工作板
8-1-2 與純文字對話的差異(線性 vs 結構化)
8-1-3 Canvas 在工作與學習中的角色
8-2 建立Canvas 文案
8-2-1 啟動Canvas
8-2-2 文字或段落編輯
8-2-3 變更文案長度
8-2-4 變更語氣
8-2-5 提出修改建議
8-2-6 問問Gemini
8-3 讓文件活起來 - Canvas「 建立」應用
8-3-1 建立網頁(Web Page)
8-3-2 建立資訊圖表(Infographics)
8-3-3 測驗(Quiz)
8-3-4 語音摘要(Audio Summary)
8-4 Canvas 設計帕斯卡三角形遊戲
8-4-1 帕斯卡三角形遊戲設計
8-4-2 可能的遊戲成果 1
8-4-3 遊戲成果 2
▌第9 章 Deep Research 深度研究
9-1 Deep Research 功能概覽
9-1-1 定義與核心定位 - 與傳統搜尋或摘要的差異
9-1-2 四大特色 - 多來源比對、分層分析、長時推理、引用透明
9-2 操作流程
9-2-1 啟動Deep Research
9-2-2 自然語言提問
9-2-3 「目錄」、「匯出」
9-2-4 建立
9-2-5 探討Deep Research 輸出形式
9-3 實際應用情境
▌第10 章 AI 導師上線 - 體驗Gemini 的引導式學習
10-1 引導式學習
10-1-1 功能定位與應用情境
10-1-2 啟用引導式學習
10-1-3 Prompt 範例
10-2 語音互動學習
10-2-1 語音學習與情境說明
10-2-2 語音互動學習實例
▌第11 章 探索Gem – 建立專屬AI 助理
11-1 什麼是 Gem
11-1-1 定義與核心理念
11-1-2 與一般 Prompt 的差異
11-1-3 Gem 的生態定位
11-2 認識與建立Gem 環境
11-3 英文單字學習卡片 Gem
11-3-1 建立畫面
11-3-2 測試「英文單字學習卡片」
11-3-3 儲存與觀察
11-3-4 Gem 列表與分享
11-4 網路電商客服 Gem
11-4-1 填寫名稱和使用說明
11-4-2 上傳Gem 的知識背景 - 相關資訊
11-4-3 Prompts 的測試
11-5 我可以稱Gem 是打造「專屬AI Agent 嗎」
▌第12 章 AI 助理Storybook
12-1 什麼是 Storybook
12-1-1 定義與基本功能
12-1-2 與一般 Gemini 對話的差異
12-1-3 為什麼適合用於創意與學習
12-2 建立 Storybook 的流程
12-2-1 啟用 Storybook 功能
12-2-2 撰寫提示(輸入主題或情境)
12-3 Storybook 的應用場景
12-3-1 客服助理培訓
12-3-2 語言學習助理
12-3-3 行銷與品牌故事
12-3-4 小結
▌第13 章 AI 圖像創作 - Imagen
13-1 什麼是 Imagen
13-1-1 Imagen 的技術背景與定位
13-1-2 與 Gemini 的整合方式
13-1-3 小結
13-2 撰寫 Prompt 的技巧
13-2-1 如何撰寫清晰有效的描述
13-2-2 加入風格、細節、色彩元素的方法
13-2-3 利用角色、場景、氛圍提升畫面效果
13-2-4 避免模糊或誤導性的指令
13-2-5 小結
13-3 Imagen 的繪畫入門與創作風格
13-3-1 啟動Imagen
13-3-2 童話風格
13-3-3 科幻未來感
13-3-4 寫實攝影風
13-3-5 教育與學習風格
13-3-6 行銷與品牌風格
13-3-7 圖像大小與比例的選擇
13-3-8 繪製4 格漫畫
13-3-9 迭代繪圖
13-4 Imagen 的應用場景
13-5 Imagen 與Gem 結合 - 設計品牌行銷Gem
13-5-1 架構化繪圖 Gem 的觀念
13-5-2 品牌視覺行銷 Gem
13-5-3 「運動鞋」和「太陽牌衛星手機」品牌宣傳
▌第14 章 Nano Banana Gemini 2.5 Flash Image
14-1 什麼是 Nano Banana
14-1-1 名稱由來與正式名稱(Gemini 2.5 Flash Image)
14-1-2 發展背景 - 從 Gemini 2.0 Flash Image過渡到 2.5
14-1-3 與 Imagen 的核心差異初探
14-1-4 小結
14-2 Nano Banana 的核心功能
14-2-1 圖生圖
14-2-2 多圖融合 - 人物移動
14-2-3 多圖融合 - 合成新圖像
14-2-4 世界知識加成 - 自動融入合理的背景元素
14-3 官網展示實例
14-3-1 官方網站展示實例
14-3-2 GitHub 網站有關Nano Banana的應用
14-4 Google AI Studio 的Nano Banana
14-4-1 認識Google AI Studio 的定位
14-4-2 進入Nano Banana 環境
▌第15 章 AI 影片生成新紀元 - Veo
15-1 Veo 的定位與特點
15-2 Veo 的操作流程
15-3 文字生成影片
15-4 圖片生成影片
15-5 文字 + 圖片 -「公仔化身飛翔的超級英雄」
15-6 Google AI Studio 的Veo
▌第16 章 Gemini App - 手機上的隨身 AI 助手
16-1 安裝與登入
16-2 操作介面導覽
16-2-1 聊天視窗與輸入方式
16-2-2 功能表欄與選單介紹
16-2-3 與電腦版的差異
16-2-4 小結
16-3 Gemini App 行動體驗特色
16-3-1 語音輸入與即時翻譯 - 快速口語互動,適合旅行或會議
16-3-2 相機拍照辨識 - 上傳照片、即時理解圖像內容
16-3-3 多模態查詢 - 文字 + 圖像結合提問
16-3-4 小結
16-4 Gemini Live
16-4-1 功能特色
16-4-2 操作方式
16-4-3 視訊
16-4-4 直播
16-4-5 暫停
▌第17 章 NotebookLM - AI 驅動的智慧筆記與學習夥伴
17-1 NotebookLM 的定位與演變
17-1-1 背景與發展簡史
17-1-2 與傳統筆記/ 知識管理工具相比之處
17-1-3 NotebookLM 在 Gemini 生態中的角色定位
17-2 NotebookLM 視窗與筆記操作環境
17-2-1 NotebookLM 主視窗
17-2-2 筆記本的存取權限 – Reader/Owner
17-2-3 設定
17-2-4 NotebookLM 筆記操作環境
17-2-5 查看檔案細節
17-2-6 返回NotebookLM 主視窗
17-3 建立NotebookLM 的知識引擎
17-3-1 來源檔案的格式與限制
17-3-2 專題實作 - 建立「AI 的歷史與未來」的知識引擎
17-3-3 建立新的筆記
17-3-4 探索(Discover)
17-3-5 新增記事
17-4 智慧「對話」 - 與 NotebookLM 的互動中樞
17-4-1 「對話」功能說明
17-4-2 實作練習 - Prompt 範例操作
17-4-3 儲存到記事
17-5 工作室 - 多模態輸出的創作空間
17-5-1 語音摘要(Audio Overviews)
17-5-2 影片摘要(Video Overviews)
17-5-3 報告生成(Reports)
17-5-4 心智圖概覽(Mind Maps)
17-5-5 智慧學習卡(Flashcards)
17-5-6 互動測驗(Quizzes)
17-6 我的筆記本
17-7 筆者操作NottebookLM 的感想