Gemini 2.0 Flash實測｜真的懂推理！電車難題、雞兔同籠難不倒它：1 秒生成最佳解|數位時代 BusinessNext

Google（谷歌）近日在AI Studio平台上推出一款名為「Gemini 2.0 Flash Thinking Experimental」的實驗性人工智慧（AI）模型，旨在提升AI在多模態理解、推理和程式碼編寫方面的能力。

更懂推理的AI：可以把大問題拆解成小問題

據Google描述，這款新模型在經過訓練後，可產生模型在回覆時會經歷的「思考過程」。 因此，Gemini 2.0 Flash Thinking的回覆，會比 Gemini 2.0 Flash基礎模型更能發揮推理能力。

更懂推理的AI：可以把大問題拆解成小問題

Google DeepMind 首席科學家 Jeff Dean 於社群平台X發文進一步表示，該模型還受益於更快的 Gemini Flash 2.0 模型帶來的速度。Dean也展示了 Gemini 2.0 Flash Thinking 如何透過一系列步驟「思考」來回答物理問題，然後再提供解決方案。

從其示範影片來看，模型的推理過程與人類執行「推理」方式仍有差異。 但關鍵是，這已經展示AI有能力將人類下的指令分解為「更小的任務」，從而產生更理想的結果。

事實上，Google於台灣時間11日深夜發布的Gemini 2.0 Flash實驗版，表現確實超出上一代的最高版本1.5 Pro不少，不但速度更快，面對問題的生成內容品質也大幅進步。以下為《數位時代》的實測結果：

測試一：「雞兔同籠」數學題

「雞兔同籠」幾乎是所有台灣學生必定會遇到的一次方程式數學考題。假設題目如下：

一個農場養了雞與兔子共15隻，兔子與雞加總後共有40隻腳，請問雞與兔各有幾隻？

以下為Gemini 2.0 Flash Experimental回答：

方法一：假設法 (最常用)
假設全部都是雞：如果15隻全部都是雞，那麼總共有15 * 2 = 30隻腳。

計算差距：實際上有40隻腳，比假設的少了40 - 30 = 10隻腳。

轉換：一隻兔子比一隻雞多2隻腳 (4 - 2 = 2)。
計算兔子數量：因為少了10隻腳，而每隻兔子可以補上2隻腳，所以兔子有10 / 2 = 5隻。

計算雞數量總共有15隻動物，兔子有5隻，所以雞有15 - 5 = 10隻。

結論：兔子有5隻，雞有10隻。

方法二：方程式法 (代數解)

設定變數：假設雞有x隻，兔子有y隻。

建立方程式：
頭的數量：x + y = 15
腳的數量：2x + 4y = 40

解方程式：
從第一個方程式得到 x = 15 - y
將x代入第二個方程式：2(15 - y) + 4y = 40

簡化方程式：30 - 2y + 4y = 40

繼續簡化：2y = 10

解出y：y = 5

將y代回 x = 15 - y，得到 x = 10

結論：兔子有5隻，雞有10隻。

測驗一小結：

相同的結果，其實提供給ChatGPT 4o會直接得到代數解法的推論過程。

但差異在於，Gemini 2.0提供三種以上的推論方案，其中第一種為國小以下可用的「假設法」，第二種才是國中以上的代數解。 換句話說，AI已有假設提問者未必具有代數觀念，因此進一步提供多種解題方案。

此外，Gemini 2.0對於自然語言的掌握度更高（更會說人話），因此推論過程說明的更仔細，對於沒有數理基礎的學生而言，應更有解題上的參考價值。

測試二：「電車難題」的法律見解

除了不會就是不會的數學題，Gemini 2.0對於抽象的倫理或法務問題能有見解嗎？答案是可以。題目如下：

一輛失控的列車在鐵軌上行駛。在列車正行進的軌道上，有五個人被綁起來，無法動彈。列車將要碾壓過他們。你站在改變列車軌道的操縱杆旁。如果拉動此杆，則列車將切換到另一條軌道上。但是，另一條軌道上也有一個人被綁著。你有兩種選擇：

1. 什麼也不做，讓列車按照正常路線碾壓過這五個人。
2. 拉下操縱杆，改變為另一條軌道，使列車壓過另一條軌道上的那個人。

請問就法規層面，以上哪個選項更理想？

以下為Gemini 2.0 Flash Experimental回答：

這個問題並沒有簡單的答案，尤其在法律層面上更是複雜。以下我將從法律的角度來分析這兩種選擇，並說明為何沒有一個絕對「理想」的答案：

選項一：什麼也不做，讓列車碾壓五人

法律觀點：在大多數法律體系中，「不作為」通常不會構成犯罪，除非法律有明確規定必須採取行動的義務。例如，消防員有義務救火，醫護人員有義務救治病人。在電車難題的情境中，你原本並沒有責任去阻止列車，因此，若你選擇什麼都不做，法律上通常不會追究你的責任。

道德爭議：雖然法律上可能沒有責任，但在道德層面上，許多人會認為你眼睜睜看著五個人死去，是一種道德上的缺失。

選項二：拉下操縱杆，改變軌道，使列車碾壓一人

法律觀點：此選項涉及「主動行為」，你主動選擇犧牲一個人來拯救五個人。這在法律上可能會構成犯罪，例如「殺人罪」。即使你的目的是為了拯救更多人，但你仍然直接導致了一個人的死亡。

例外情況：在極少數情況下，法律可能會考慮「緊急避難」原則。此原則允許在為了避免更大的損害時，採取一些看似違法的行為。然而，要符合緊急避難的條件非常嚴格，通常需要證明：

存在迫在眉睫的危險。

沒有其他可行的解決方案。

所造成的損害必須小於所避免的損害。

在電車難題的情境中，是否符合緊急避難原則存在爭議。 法律很難界定「五條人命」是否一定比「一條人命」更重要。此外，你是否真的「沒有其他選擇」也可能受到質疑。

總結：
從法律層面來看，兩個選項都存在爭議，沒有一個絕對「理想」的答案：

選項一（不作為） ：法律責任較小，但可能面臨道德譴責。

選項二（主動作為） ：可能觸犯法律，但或許在某些極端情況下可主張緊急避難。

測驗二小結：

就此問題而言，若使用GPT-4o，會無法辨識題目，無法得到解答。但若切換到最新的o1模型，ChatGPT的結論則未有定論。但有解釋「行為與不作為的區別」，拉動操縱杆可能會被視為積極行為；若不作為，除非有特定的法律義務，否則不作為通常不會構成犯罪責任。

其生成品質可說雷同，但在聚焦爭議問題的癥結上，仍是Gemini 2.0的闡述方式相對清晰。

測試三：台灣人年均手搖飲消費估算

第三題，為了測驗AI真實的推論、資料蒐集，以及假設能力，題目如下：

根據最新數據，台灣2024年手搖飲產值有多少？換算下來，台灣人一年平均喝多少杯？

以下為Gemini 2.0 Flash Experimental回答：

要精確得知2024全年手搖飲的產值，需要等到年底或隔年初相關機構的完整統計出爐。目前，我們能參考的是一些趨勢和部分已公布的數據來推估。

預估：有新聞報導指出，基於國人對飲料的喜愛，手搖飲品牌及品項持續推陳出新， 預估2024年飲料店全年營業額可能突破1300億元。

推估2024年產值與人均杯數 ：
由於缺乏2024全年完整數據，我們只能基於現有資訊進行推估。

產值推估 ：若以新聞報導預估的1300億元為基準，這包含所有飲料店的營業額，手搖飲佔其中大部分。 假設手搖飲佔總營業額的70%（這是一個假設，實際比例可能更高或更低），則2024年手搖飲的產值可能約為910億元。

人均杯數推估 ：要換算成人均杯數，需要知道平均每杯手搖飲的價格。假設平均每杯價格為60元（這也是一個假設，實際價格因品項和地區而異），則 910億元的產值約可換算成15.17億杯手搖飲。以台灣2350萬人口計算，平均每人每年喝掉約64.5杯手搖飲。

測驗三小結：

相同的題目，ChatGPT 4-o與o1的答案略有不同。

以4-o來說，其指出台灣2024年手搖飲市場的產值預計將達到 500億元新台幣（與實際預估值差異頗大）。如果將這個數字換算為每位台灣人的年均消費量， 根據台灣人口約為2,300萬人，假設每杯手搖飲的平均價格為50元新台幣，那麼每人每年大約會喝43杯手搖飲。

至於o1，則依照2023年產值推論2024年手搖飲市場產值約為3,000億， 但實際計算時，反而假設「平均每人每月飲用手搖飲4杯」，直接換算12個月，因此每人年均48杯，其推論基礎顯然與先前數據不符。

結論：Gemini 2.0 Flash優於GPT4-o / o1

總結而言， 推測Gemini 2.0 Flash基於對繁體中文的深度學習較為完整，因此似乎更能理解使用者的提問，因此可提供更為理想的生成結果。

除了語言能力較佳之外，Gemini 2.0 Flash對於資料蒐集的能力也較為出色。以上述測驗三為例，後續查證2024年手搖飲估計可達1300億元的數據，為經濟部統計處於8月時提供。因此確有其事。反觀，GPT4-o / o1在數據蒐集階段就有誤，且並未依照數據推論人均杯數。

而在假設能力上，Gemini 2.0 Flash在測驗一更為突出（假設使用者未必懂代數），在測驗三，也在1300億元中假設可能僅7成為飲品本身產值。

但話說回來，本次實測僅以三題判斷，確實可能有遺漏ChatGPT強項之處，例如：難度更高的數理、物理難題測試，抑或是編寫程式碼的能力等等。

而AI工具目前堆陳出新不斷，今天落後的模型很有可能下一季就超車。因此，呼籲使用者仍必須透過自己的使用習慣，來測試各種AI的適用程度。

延伸閱讀：Google發布Gemini 2.0！AI助手Astra大升級：可聽懂晶晶體、看圖辨位⋯還能兼電玩教練？
外媒實測5大AI工具：Perplexity打敗ChatGPT、Gemini奪第一！黃仁勳也愛用它
 實測|免費版Perplexity、ChatGPT 4o、Claude誰最好用？小編提升工作效率首選它！

資料來源：Google、TechChurch、The Verge

責任編輯：李先泰

AI 與數據正快速落地至各行各業，從製造、金融、電信、醫療到零售，應用速度不斷加快。但在每年交易規模至少新台幣 1900 億元的商用地產領域，卻長期受到數據破碎且不透明的限制，只能仰賴人力蒐集資訊，再憑直覺和經驗去解讀資訊、做出決策，使 AI 潛在價值難以真正發揮。為回應產業轉型的核心痛點，方睿科技首度舉辦「商用地產生態系年會 2026 Raise Day」，以開放式平台為核心，串聯專業地產服務商、空間相關企業服務商、產業專業人士等多元角色，勾勒出 B2B 企業服務生態系的全貌，希望能透過科技促進數據流動，為商用地產企業協作模式開啟新的可能性。

方睿科技雙軌策略，讓 AI 成為商用地產的決策引擎

方睿科技創辦人暨執行長吳健宇指出，在 AI 時代，人應該專注於「最有價值」的工作；然而在商用地產業中，專業人士卻有約 70% 的時間耗費在資料蒐集與整理上，真正用於判斷與決策的時間僅約 10%。方睿科技希望翻轉這樣的時間分配，讓人力從低價值的資料處理中解放，將更多心力投入在判斷、溝通與決策等創造價值的商業活動。

為此，方睿科技提出兩條實踐路徑。第一條是建構出具備完整性、易用性與進化性的商用地產智慧平台，運用 AI 技術，將過去產業中破碎、非結構化的資料，重塑為可被運算、可驗證的標準化數據，並結合圖表與互動式介面，讓使用者能夠快速得到完整市場資訊，實現「用戶即專家」的目標。

第二條則是推動生態系聯盟，將不動產視為企業服務的核心載體，串聯設計、家具、搬遷、清潔等多元服務夥伴，使空間不再只是靜態標的，而是承載案例、服務與數據回饋的生態系節點。透過生態系夥伴累積的實務資料與服務紀錄，平台得以發展「資料即推薦」模式，推動商用地產從單點交易，邁向可擴張的 B2B 服務網絡。

獨創「資料飛輪」機制，實現用戶即專家目標

在 AI 模型日益普及的當下，真正的競爭關鍵已不在模型本身，而是能否有效率地收集資料、提高資料品質，並將其與實際決策流程緊密結合。為此，方睿科技獨家設計出一個由「資料收集、資料精煉、專家把關、決策反饋」組成的資料飛輪，回應商用地產長期面臨的資料破碎與決策效率低落問題，成為方睿科技實踐願景的第一條路徑。

方睿科技技術長郭彥良進一步說明，資料飛輪機制的運作架構。首先在資料收集階段，必須系統性蒐集公開資料、內部檔案與報告，並透過 AI 協作將圖片等非結構化資訊轉換為可用的結構化數據。接著進入資料精煉，透過資料清洗與實體對齊，將原始資訊從單純的可閱讀升級為可比較、可推論的決策依據。第三步專家把關，則引入不動產專家進行校正與產業判讀，補上模型難以理解的規則與慣例，確保關鍵數據的正確性。最後的決策反饋階段，藉由收集使用者提問與行為，檢視現有資料是否足夠精準，再回到專家校正與補齊流程，使整個系統能隨使用頻率提升而持續進化。

在資料飛輪的運作基礎上，方睿科技正積極研發商用地產智慧平台 PickPeak。郭彥良表示，PickPeak 並非單純的物件搜尋工具，而是結合深度資料與 AI 的決策輔助平台。使用者可透過自然語言互動，提出人數、預算、區位、產業屬性等多重條件，再由系統動態生成可比較、可驗證的選址方案，真正將 AI 從「回答問題的工具」，轉化為「陪伴決策的數位專家」。

創新 Data to win 模式，讓 AI 深入商用地產各階段決策流程

不過，單靠數據整合與 AI 應用仍不足以支撐產業全面升級，因此，方睿科技提出的第二條路就是，推動產業生態系聯盟，整合商用地產市場上不同角色的數據，讓 AI 能夠真正成為商用地產決策時的智慧引擎。

方睿科技不動產知識創新中心總監曾凡綱指出，目前在企業、房東或物業主與各類服務供應商之間，缺乏有效的整合機制，導致企業在選址與空間規劃過程中，難以快速找到真正合適的服務與解決方案，形成明顯的產業斷點。

為解決這些斷點，方睿科技提出「Data to win」模式，以資料取代傳統「Pay to win（付費買廣告）」思維，讓真正具備經驗與實績的服務夥伴，在適當的決策節點被看見。

曾凡綱說明，在廣告投放效益越來越低的情況下，企業服務商面臨的問題已不只是「如何曝光」，而是「如何在對的地方被看見」，這將是未來的市場勝出指標；而 Data to win 正好可以協助企業服務商建立此能力，方睿科技將生態系夥伴所擁有的案例、服務紀錄與產業知識等資料，經過去識別化與結構化處理後，再嵌入企業決策流程中，讓推薦不再來自廣告投放，而是真實、可被驗證的使用經驗，透過這樣的機制，不僅提升企業決策的準確度，也能同步放大生態系夥伴在合作中的實質價值。

舉例來說，方睿科技整合辦公傢俱夥伴 Backbone 班朋實業長期累積的辦公室規劃案例與平面圖資料，讓企業在選址階段，就能同步評估空間規劃方案，加速決策流程。又如，整合出行服務夥伴 USPACE 悠勢科技的服務資料，並呈現在地圖上，協助企業評估辦公據點的交通便利性，優化員工日常通勤與出行體驗。此外，平台也可整合大樓的 ESG 認證、公共設施與服務層資訊，協助企業快速篩選符合需求的辦公大樓，提升進駐媒合效率。

「Raise Day 只是這場變革的起點。」吳健宇強調，方睿科技已經透過投資與合夥模式，將布局延伸至專業地產服務與空間經營領域，至今旗下已有商用不動產仲介、顧問與估價等專業服務的宇豐睿星，以及聚焦商用地產代銷市場的希睿創新置業。透過直接參與第一線實務運作，方睿得以更深入理解產業真實痛點，讓科技不只是工具，而能真正回應實際決策與服務需求。

此外，方睿科技未來也將持續擴大「商用地產 x 企業服務生態系」聯盟，目前包括 Backbone、USPACE、IKEA For Business、潔客幫等企業服務夥伴已率先加入；接下來，方睿科技將邀請更多擁有關鍵數據與專業能力的企業服務商加入，讓數據在安全、可控的前提下流動，進一步釋放商用地產在選址、營運與企業服務等全生命週期中的結構性價值，為產業轉型啟動下一個關鍵階段。

右起方睿科技共同創辦人暨營運長陳致瑋、USPACE悠勢科技共同創辦人暨執行長宋捷仁、Backbone班朋實業創辦人暨執行長廖家葳，透過企業服務生態系合作共同為產業啟動下一個關鍵階段。

圖／數位時代

方睿科技官網： https://www.funraise.com.tw