AI時代新篇章：用戶體驗設(shè)計的智能革命與未來展望

2024-6-19 ui設(shè)計分享達(dá)人

隨著ChatGPT在23年初的火熱，AI熱潮已經(jīng)開始席卷各行各業(yè)，人們對于AI的熱情就像是看著第一款iPhone發(fā)布或者蒸汽機(jī)的發(fā)明，期待著它帶來一場信息時代的工業(yè)革命。同時，AI替代60%崗位的口號也足以讓相關(guān)從業(yè)者感到前所未有的壓力與焦慮。在各大設(shè)計網(wǎng)站上，關(guān)于AI的內(nèi)容肉眼可見的占據(jù)了越來越多的比重，包括AI在設(shè)計流程中的應(yīng)用、各種AI最新工具等介紹、AI的使用技巧、AI生成的海報/插畫等作品……一瞬間，似乎全民都投入到了AI的浪潮之中。

反過頭來看，對于用戶體驗設(shè)計而言，由于產(chǎn)品的底層邏輯被AI改寫，產(chǎn)品的生態(tài)、單個產(chǎn)品的形態(tài)、使用方式等都將發(fā)生翻天覆地的變化。連帶著的，由于生產(chǎn)工具的變革，產(chǎn)品的設(shè)計、開發(fā)流程也將隨之發(fā)生變化，進(jìn)一步提高效率，對于從業(yè)人員的能力要求也在實時更新。

對于這樣一種浪潮，埋頭當(dāng)個鴕鳥或者嗤之以鼻是沒有意義的，我們需要看到、認(rèn)識、擁抱它。所以有人笑稱：打不過就加入。同時，對于各種所謂干掉各個崗位的宣傳，也吸引著、推動著我們?nèi)チ私鈱⒈皇裁锤傻粢约霸趺幢桓傻簟?/section>

從另一方面講，只有在技術(shù)變革的時候，彎道超車才有可能。如果只是沿用之前的經(jīng)驗與技術(shù)，那么成熟的企業(yè)就會有先發(fā)優(yōu)勢。但是當(dāng)面對新的技術(shù)變革時，大家被拉回到同一起跑線上，這個時候，就看誰能夠找到正確的方向，率先突圍。

所以，不管是被動也好，還是主動也好，面對著新一輪的技術(shù)變革，也希望從AI能力本身、所帶來的變化、以后的發(fā)展等方面全面了解一下這個新的時代寵兒。

本文結(jié)構(gòu)：

1 AI相關(guān)概念與術(shù)語

1.1 AI&AIGC

人工智能或者說AI，Artificial Intelligence。是用機(jī)器來模擬人的智能或者思維模式來完成各項任務(wù)目標(biāo)。

從其工作的機(jī)制而言，目前主要分為兩種：決策式人工智能，生成式人工智能。

決策式人工智能。根據(jù)已有數(shù)據(jù)進(jìn)行分析、判斷、預(yù)測，比如我們常見的抖音、頭條、淘寶等的推薦算法。
生成式人工智能。通過分析現(xiàn)有數(shù)據(jù)來生成模仿、拼合、創(chuàng)造新的內(nèi)容。比如當(dāng)下最熱的chatGPT、Midjourney、Sora等。

從能力角度而言，人工智能也可以分為強(qiáng)人工智能和弱人工智能。

強(qiáng)人工智能。通用型人工智能（AGI，Artificial General Intelligence）。能夠像人類一樣對不同領(lǐng)域進(jìn)行記憶、推理和解決問題。領(lǐng)域間的知識與經(jīng)驗可以遷徙、借鑒，是“通才”。既可以寫詩畫畫，又可以診斷疾病，還可以進(jìn)行數(shù)學(xué)計算。
弱人工智能。在某一領(lǐng)域具備專業(yè)能力、解決特定問題，能力沒法泛化，是專才。比如下圍棋的AlphaGo，可以打敗人類圍棋世界冠軍，但是沒法回答你“白毛浮綠水”的下一句是什么。

AIGC（Artificial Intelligence Generative Content）

人工智能生成的內(nèi)容，包括文本、語音、圖片、視頻等多種形式。

AI生成內(nèi)容

1.2 AI Agent

1.2.1 人類與AI協(xié)作的三種模式：

嵌入（Embedding）模式：類似于L2級別的自動駕駛。人類占據(jù)主導(dǎo)，AI作為工具，執(zhí)行某條具體的命令。
副駕駛（Co-pilot）模式：類似于L3級別的自動駕駛。人與AI共同參與，與人類之間互相協(xié)商、溝通，實現(xiàn)某一目標(biāo)。
智能體（Agent）模式：類似于L4級別的自動駕駛。人類作為指揮者、監(jiān)督者、評估者。AI作為獨立的行動者，自主分析目標(biāo)、拆解任務(wù)、嘗試執(zhí)行、對比結(jié)果與目標(biāo)、優(yōu)化執(zhí)行步驟與方式并最終實施完成人類設(shè)立的目標(biāo)。

AI與人類協(xié)作模式

1.2.2 AI Agent是什么

AI Agent是有能力主動思考和行動的智能體。讓任務(wù)自動化，主要包括感知、記憶、規(guī)劃與決策、行動/使用工具。

就像吳恩達(dá)在TED演講中提到的：“許多工作包含不同的任務(wù)，AI自動化的是任務(wù)而不是工作。”與直接使用大語言模型相比，AI Agent能夠依據(jù)目標(biāo)分解復(fù)雜的工作流程，從而實現(xiàn)大語言模型的自我對話與運轉(zhuǎn)，而不是簡單地執(zhí)行單一任務(wù)或者由人類來驅(qū)動任務(wù)的每一步。

AI Agent = 感知（Perceive）+LLM（記憶（Memory）+規(guī)劃（Planning ））+工具使用（Tool use）/行動（Action）

AI Agent

感知是AI Agent使用傳感器與周圍環(huán)境交互，感知真實的物理世界，這個部分涉及到多模態(tài)的信息解析與處理。
記憶讓AI Agent可以存儲關(guān)于某些方向的專業(yè)知識以及交互過程中產(chǎn)生的信息，從而利用這些經(jīng)驗來支持、優(yōu)化后續(xù)的決策與行動。
規(guī)劃和決策就像是通過大腦進(jìn)行分析，包含事前規(guī)劃和事后反思。LLM在這里就類似于大腦。AI Agent讓AI不再是執(zhí)行單一的任務(wù)，而是自動將復(fù)雜的任務(wù)拆解為一個個可執(zhí)行的子任務(wù)步驟，然后按照順序執(zhí)行，并結(jié)合感知與記憶信息在過程中不斷試錯、優(yōu)化，最終得到滿足目標(biāo)的結(jié)果。
工具的使用就像是能力集成/封裝，類似于APP將能力打包的邏輯（比如修圖類app可以提高亮度、裁剪畫面、改變色彩等等）。通過利用外部的資源或工具來執(zhí)行任務(wù)，從而拓展AI Agent的能力邊界。
同時各個AI Agent之間還能夠彼此溝通、協(xié)作，通過不同能力之間的配合來發(fā)揮最大的效用。

AI Agent本質(zhì)而言是一個更好發(fā)揮大模型能力的技術(shù)框架，是圍繞LLM搭建的一套程序。讓用戶不再只是與LLM進(jìn)行對話，而是根據(jù)場景，借助LLM 的分析、推理能力，制定解決思路并調(diào)用不同的工具的能力，從而解決問題或者達(dá)成既定目標(biāo)。簡單理解為一個會使用大語言模型能力以及各類工具來幫助人類解決問題的助理。

1.3 AI的算法

1.3.1 AI的三大流派

1.3.1.1 符號主義：

基于統(tǒng)計方法，通過建模預(yù)測讓機(jī)器通過計算來模擬人的智能，實現(xiàn)識別、預(yù)測等任務(wù)

主要代表算法有：樸素貝葉斯，邏輯回歸，決策樹，支持向量機(jī)。

1.3.1.2 連接主義：

認(rèn)為生物智能是由神經(jīng)網(wǎng)絡(luò)產(chǎn)生的，可以通過人工方式構(gòu)造神經(jīng)網(wǎng)絡(luò)，訓(xùn)練神經(jīng)網(wǎng)絡(luò)產(chǎn)生智能。也就是模擬人的腦部神經(jīng)系統(tǒng)，通過構(gòu)建神經(jīng)元與他們之間的連接，來構(gòu)建一個可以學(xué)習(xí)、推理的神經(jīng)網(wǎng)絡(luò)。

主要代表就是神經(jīng)網(wǎng)絡(luò)算法。

1.3.1.3 行為主義：

認(rèn)為生物的智能來自對外界的復(fù)雜環(huán)境進(jìn)行感知和適應(yīng)，通過與環(huán)境和其他生物之間的相互作用，產(chǎn)生更強(qiáng)的智能。也就是通過嘗試與反饋來強(qiáng)化學(xué)習(xí)、改進(jìn)系統(tǒng)自身的行為。

主要代表算法是強(qiáng)化學(xué)習(xí)。

1.3.2 目前主流的算法：

目前主流的算法都是基于神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)，在此基礎(chǔ)上創(chuàng)新與結(jié)合。

1.3.2.1 神經(jīng)網(wǎng)絡(luò)（Neural Network）

人工智能三大流派中的連接主義的代表算法，通過人工方式構(gòu)造神經(jīng)網(wǎng)絡(luò)，訓(xùn)練神經(jīng)網(wǎng)絡(luò)產(chǎn)生智能。最早起源于麥卡洛克-匹茲模型/M-P神經(jīng)元模型（McCulloch-Pitts model）。

簡單來說就是模仿人腦的神經(jīng)元結(jié)構(gòu)，構(gòu)建一個函數(shù)集合作為基本單元，然后再互相之間加權(quán)拼接形成神經(jīng)網(wǎng)絡(luò)。一個神經(jīng)元就是一個函數(shù)/規(guī)則，前一個神經(jīng)元的輸出作為后一個神經(jīng)元的輸入。

循環(huán)神經(jīng)網(wǎng)絡(luò) （Recurrent Neural Networks, RNN）

神經(jīng)網(wǎng)絡(luò)的一種。關(guān)鍵在于多一個隱藏層，可以將上一次的輸出產(chǎn)生的輸出作為這一次輸入的一部分。簡單來說就是能夠記住上下文信息。

在此基礎(chǔ)上演變出來的長短期記憶（Long short-term memory, LSTM），讓模型可以去選擇記住什么信息、忘掉什么信息，而不是越早的信息記憶得越少，或者無差別地全部記住前文的信息，避免短期記憶、梯度爆炸、梯度消失等問題。（梯度可簡單理解為變化率）

主要用于語音分析、文字分析、時間序列分析。

卷積神經(jīng)網(wǎng)絡(luò)（ Convolutional Neural Network, CNN）

基本機(jī)構(gòu)包含輸入層、卷積層、池化層、全聯(lián)接層、輸出層。

卷積層的主要目的是識別與提取不同的局部特征。

池化層也叫降采樣層，其本質(zhì)是采樣共享。簡單來說就是通過用同一個采樣值（最大值或者平均值之類）來代替那些差別不大的采樣值，以便減少數(shù)據(jù)量。

主要用于圖像識別、人臉識別等。

1.3.2.2 生成式對抗網(wǎng)絡(luò)（Generative Adversarial Networks, GAN）

主要包含生成器(Generator)、判別器(Discriminator)。

生成器用于生成內(nèi)容，判別器用于判斷生成網(wǎng)絡(luò)中產(chǎn)生的內(nèi)容是真實數(shù)據(jù)還是生成的數(shù)據(jù)。

生成器要不斷優(yōu)化自己的生成數(shù)據(jù)讓判別器判別不出來；判別器也要優(yōu)化自己的判斷能力，使其更準(zhǔn)確；通過互相之間的對抗、制約來實現(xiàn)訓(xùn)練過程。

1.3.2.3 Transformer模型：

谷歌的論文《Attention Is All You Need》中提出一種神經(jīng)網(wǎng)絡(luò)模型架構(gòu)。主要特點在于加入自注意力（Self-attention）機(jī)制來處理序列數(shù)據(jù)。

自注意力機(jī)制通過給長文本中每個詞不一樣的權(quán)重來判斷每個詞之間的相關(guān)性，從而判斷整個文本中最重要的部分。

與RNN相比，Transformer會將一串序列中的每個詞的意義及其位置信息結(jié)合起來傳輸給神經(jīng)網(wǎng)絡(luò)，從而讓模型可以同時處理序列里的所有位置的信息，而不需要像RNN那樣依次處理。這種并行計算帶來的好處是大大提高了模型的訓(xùn)練速度，從而為大模型的發(fā)展奠定了基礎(chǔ)。

1.3.3 自然語言處理（Natural Language Processing, NLP）

“語言理解是人工智能領(lǐng)域皇冠上的明珠”——比爾蓋茨

自然語言處理（NLP）就是在機(jī)器語言和人類語言之間溝通的橋梁，終極目標(biāo)就是讓人和機(jī)器能夠通過自然語言進(jìn)行交互，也就是讓機(jī)器能夠理解人類的語言、文字等。

主要包含自然語言理解（NLU）和自然語言生成（NLG）。簡單來說就是聽懂人話和說人話。

1.3.4 機(jī)器學(xué)習(xí)（Machine Learning, ML）

所有的對象，不論人類、動物，甚至是無生命機(jī)械，如果接受外界信息的刺激之后，能形成經(jīng)驗反應(yīng)，并影響日后的行為，那其實這個過程就已經(jīng)可以稱之為“學(xué)習(xí)”了。——《智慧的疆界：從圖靈機(jī)到人工智能》

機(jī)器學(xué)習(xí)是實現(xiàn)人工智能的核心方法。從有限的觀測數(shù)據(jù)中“學(xué)習(xí)”（or“猜測”）出一個具有一般性的規(guī)律，并利用這些規(guī)律對未知數(shù)據(jù)進(jìn)行預(yù)測的方法。

簡單來說，機(jī)器學(xué)習(xí)就是通過數(shù)據(jù)訓(xùn)練讓算法掌握規(guī)律。

機(jī)器學(xué)習(xí)

1.3.4.1 深度學(xué)習(xí)（ Deep Learning）

機(jī)器學(xué)習(xí)的一個分支。使用深層次神經(jīng)網(wǎng)絡(luò)模型進(jìn)行學(xué)習(xí)。深度是指模型有多個層次的神經(jīng)元。通過逐層分解來解決復(fù)雜度較高的問題。

深度學(xué)習(xí)與傳統(tǒng)機(jī)器學(xué)習(xí)最大的區(qū)別在于使用神經(jīng)網(wǎng)絡(luò)模型代替人工的特征提取過程，通過數(shù)據(jù)訓(xùn)練來優(yōu)化模型的表現(xiàn)。

可簡單理解為使用神經(jīng)網(wǎng)絡(luò)算法的機(jī)器學(xué)習(xí)。

1.3.4.2 監(jiān)督學(xué)習(xí)（Supervised Learning）

有標(biāo)準(zhǔn)答案的學(xué)習(xí)。其基本思想是利用帶有標(biāo)簽的訓(xùn)練數(shù)據(jù)來訓(xùn)練模型，從而使其能夠從輸入數(shù)據(jù)中學(xué)習(xí)到輸入與輸出之間的映射關(guān)系，然后可以利用這個映射關(guān)系對新的未打標(biāo)簽數(shù)據(jù)進(jìn)行預(yù)測。

監(jiān)督學(xué)習(xí)需要告訴模型：1. 事物的關(guān)鍵特征是什么（稱為特征）；2. 那東西到底是什么。就像學(xué)生刷題，通過練習(xí)獲得的經(jīng)驗來解新的題目。

1.3.4.3 無監(jiān)督學(xué)習(xí)（Unsupervised Learning）

沒有標(biāo)準(zhǔn)答案的學(xué)習(xí)。其目標(biāo)是讓模型從未標(biāo)記的數(shù)據(jù)中自行發(fā)現(xiàn)共性、結(jié)構(gòu)、模式、關(guān)聯(lián)或者表示，而無需使用人工標(biāo)簽或者先驗知識的指導(dǎo)。包括聚類、降維、異常檢測等。

1.3.4.4 強(qiáng)化學(xué)習(xí)（Reinforcement Learning）

與監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)類似，也是一種機(jī)器學(xué)習(xí)的方式。

算法不斷的嘗試、試錯，反饋機(jī)制通過獎賞與懲罰告訴算法哪種是好的，哪種是不好的，從而規(guī)訓(xùn)其行為方向。簡單來說就是獎勵積極行為和懲罰消極行為。

美劇《生活大爆炸》中Sheldon就使用巧克力作為獎勵，馴化Penny的行為。

美劇《生活大爆炸》劇照

1.3.5 大語言模型（Large Language Model, LLM）

是一種基于神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)、自然語言處理技術(shù)的模型，目前大部分知名的大語言模型都是基于Transformer架構(gòu)。

它通過將每個詞轉(zhuǎn)化為向量輸入到模型中，并使用大量的文本數(shù)據(jù)進(jìn)行訓(xùn)練，讓模型來學(xué)習(xí)服務(wù)人類語言理解和生成的能力。

大語言模型的【大】主要體現(xiàn)在訓(xùn)練數(shù)據(jù)與模型參數(shù)的大，從而需要更高的算力支持。

與傳統(tǒng)的機(jī)器學(xué)習(xí)模型相比，大模型具有更強(qiáng)的表示能力和泛化能力，能夠處理海量數(shù)據(jù)、完成各種復(fù)雜的任務(wù)，如自然語言處理、計算機(jī)視覺、語音識別等。

2 AI能力分析

2.1 人類能力地形圖

機(jī)器人專家漢斯·莫拉維克（Hans Moravec）曾提出人類能力地形圖的概念，其中，海拔高度代表這項任務(wù)對計算機(jī)的難度，不斷上漲的海平面代表計算機(jī)現(xiàn)在能做的事情。

圖源：https://qph.cf2.quoracdn.net/main-qimg-dfa49b90572af22a8b8e9ec7c02b8688

AI的發(fā)展，會逐漸淹沒人類的特有的優(yōu)勢領(lǐng)域。最終，當(dāng)AI開始具備設(shè)計人工智能的能力（AI Design），AI能力的推動將有AI自己的改進(jìn)來推動，其速度會比由人類推動快得多。這也是所謂的“奇點”，到達(dá)奇點，人工智能將出現(xiàn)爆發(fā)式的增長。

就目前而言，人類與AI各有優(yōu)勢，所以人類與AI攜手合作，發(fā)揮各自的優(yōu)勢，形成群體智慧，實現(xiàn)1+1> 2 才是最優(yōu)解。

2.1.1 人類相比于AI，所擁有的優(yōu)勢：

自主創(chuàng)造、構(gòu)思以及戰(zhàn)略性規(guī)劃、精細(xì)化決策
具有同理心，能夠理解人類的情緒、情感
對于美的理解與感受
不同領(lǐng)域之間的經(jīng)驗可以遷徙、復(fù)用
具備常識
具有價值觀、人生觀、世界觀，能夠理解人類的行為與文化
可以完成精確且復(fù)雜的體力工作
可以輕松界定思考問題的框架，也就是哪些問題與任務(wù)相關(guān)，哪些無關(guān)

2.1.2 AI相比于人類，所擁有的優(yōu)勢：

沒有情感等主觀因素，比人類更理性，可以公正客觀對待每個方案
可以在極短時間內(nèi)完成超復(fù)雜的運算，從而產(chǎn)出大量的方案與探索結(jié)果
可以長時間不厭其煩做同一件事，而且不會累或者因為疲勞而降低準(zhǔn)確度
記憶力好，積累的經(jīng)驗可以被隨時調(diào)用

2.2 發(fā)揮各自最大的優(yōu)勢

對于AI將會取代人類，現(xiàn)在最常見的說法就是：

AI將改變或者消滅某些工作，同時創(chuàng)造出新的工作。
AI不會取代人，而會使用AI工具的人將取代不會使用AI工具的人。

讓AI解放人類的雙手，去做那些機(jī)械性、重復(fù)、無聊的計算工作。而人類則把時間精力投入到更有價值的工作比如規(guī)劃、決策、制定目標(biāo)、人際關(guān)系維護(hù)等。

當(dāng)然，二者之間的工作并不是完全剝離、獨立的，而是互相影響與溝通協(xié)作。比如，人類可以借用AI的數(shù)據(jù)分析能力、預(yù)測結(jié)果等增強(qiáng)自己的決策能力。

所以，一方面，人要學(xué)習(xí)怎么更好地使用AI，發(fā)揮AI最大的價值。另一方面，AI也要往增強(qiáng)人類能力、改善人類社會生活的方向發(fā)展。

3 AI能力加持后，產(chǎn)品/業(yè)務(wù)層面變化

3.1 產(chǎn)品邊界變得模糊

3.1.1 物理世界與數(shù)字世界深度融合

數(shù)字孿生將物理世界映射到數(shù)字世界，具身智能機(jī)器人、自動駕駛等讓數(shù)字世界操控物理世界。AI能力的強(qiáng)化則讓二者之間的融合更加深入。比如京東AI數(shù)字人“采銷東哥”，看面相幾乎和真人無異，可以在直播間為大家介紹各種產(chǎn)品。如果再進(jìn)一步，可以實時回答觀眾的問題，那就與真人差別不大了。

3.1.2 產(chǎn)品成為能力中心

產(chǎn)品之間的壁壘打通，成為能力插件，主要在于提供某種能力。比如小D想通過視頻學(xué)習(xí)糖醋排骨的做法，那么AI所獲取的內(nèi)容可能會來自于抖音、快手、淘寶直播、小紅書等等平臺，或者整合各平臺內(nèi)容生成一個新的、針對于小D喜好的內(nèi)容。平臺成為底層信息的提供方或者說資源池，用戶也無需在多個產(chǎn)品之間來回切換。

3.1.3 服務(wù)設(shè)計

由于AI對流程中每一個觸點信息的掌握以及對于各項能力的集成，使得根據(jù)場景調(diào)用不同能力以滿足需求成為可能。

產(chǎn)品的設(shè)計不止考慮單一的產(chǎn)品，而是要考慮與其他產(chǎn)品、能力、服務(wù)的配合。在使用環(huán)境/場景中，從用戶的歷程出發(fā)，滿足用戶在整個任務(wù)鏈路中每一個節(jié)點的需求。

3.1.4 流程自動化

產(chǎn)品與產(chǎn)品之間的互相銜接、流轉(zhuǎn)也將自動化，無需由用戶來推動。比如小D要出差，當(dāng)他向AI提出這個需求時，AI一并將機(jī)票、酒店同步預(yù)定好，同時，在出差結(jié)束后，自動對接人事考勤、費用報銷等產(chǎn)品能力，實現(xiàn)流程自動化。也就是依據(jù)場景將服務(wù)打包，用戶觸發(fā)一次就完成整個流程動作，無需到每一個系統(tǒng)/產(chǎn)品中分別去執(zhí)行一遍操作。

流程自動化帶來的也是效率和易用性的提升，用戶的操作負(fù)擔(dān)被大大減少。

3.1.5 B/C端差異減少

B端各流程節(jié)點之間的溝通、協(xié)作、傳遞也可以由【人-產(chǎn)品-人】的方式轉(zhuǎn)變?yōu)椤続gent-Agent】的方式。提高流程運轉(zhuǎn)的效率，降低了B端產(chǎn)品的操作復(fù)雜度。

當(dāng)用戶與AI Agent交互，由Agent代替用戶去直接面對、調(diào)用各個產(chǎn)品的各項能力，發(fā)起各種任務(wù)，B端產(chǎn)品和C端產(chǎn)品交互的邏輯會愈發(fā)類似。Agent對話式的交互、自動規(guī)劃等將會大大減少B端產(chǎn)品的學(xué)習(xí)成本，用戶在使用不同類型產(chǎn)品時將不會有太大的差異。

3.1.6 多產(chǎn)品形態(tài)互聯(lián)互通

AI可以在手機(jī)、平板、電腦、電視、車載終端等不同設(shè)備之間的無縫切換，設(shè)備跟著場景轉(zhuǎn)換，但是流程不中斷，多設(shè)備協(xié)調(diào)配合走完整個任務(wù)鏈路。比如在下班回家的路上，小D在車?yán)锫犘≌f，回家以后，家里的智能音箱繼續(xù)從下車時刻的部分開始繼續(xù)播放。

3.2 接受非結(jié)構(gòu)化的信息

語音識別、NLP、圖片識別、手勢識別、紅外傳感、重力感應(yīng)、腦機(jī)接口等等技術(shù)的演進(jìn)與突破。讓輸入不再依賴于表單、按鈕等創(chuàng)建符合計算機(jī)理解模式的結(jié)構(gòu)化信息。

非結(jié)構(gòu)化輸入的特點：多模態(tài)、更自然、更高效、學(xué)習(xí)成本更低。不再是人去適應(yīng)計算機(jī)能接受的數(shù)據(jù)模式，而是計算機(jī)來學(xué)習(xí)理解人類的信息表達(dá)形式，比如表情、手勢、語氣等。

AI對于非結(jié)構(gòu)化數(shù)據(jù)、自然語言的理解，也降低了產(chǎn)品的復(fù)雜度，減少用戶的認(rèn)知負(fù)擔(dān)，讓產(chǎn)品的學(xué)習(xí)成本大大減低。

3.2.1 普適計算（ubiquitous computing）

普適計算是指計算可以在任何設(shè)備上、在任何地理位置中以及用任何格式進(jìn)行。其顯著目標(biāo)之一則是使得計算機(jī)設(shè)備可以感知周圍的環(huán)境變化，從而根據(jù)環(huán)境的變化做出自動的基于用戶需要或者設(shè)定的行為。

與物聯(lián)網(wǎng)類似，簡單來說就是通過多樣化的設(shè)備（手機(jī)、手表、眼鏡、微波爐、冰箱等）來感知信息、獲取信息、處理信息，所有的物品都有可能變成一個計算機(jī)。這樣的目的是讓計算機(jī)可以隨時感知環(huán)境、行為的變化，從而及時、貼心地滿足用戶的需求。

3.3 數(shù)據(jù)的集中化處理

假設(shè)個人助手或者說AI Agent的成熟，那么人們與產(chǎn)品交互的通道將會從各個分散的產(chǎn)品集中到一個點。由統(tǒng)一的交互入口收集的用戶行為數(shù)據(jù)以及AI主動通過各類設(shè)備收集的用戶個人數(shù)據(jù)，讓每個人的信息更加完整、全面地被AI所記錄，更容易實現(xiàn)個人數(shù)據(jù)的集中化處理。

AI掌握的個人信息越多，才能更全面地了解一個人，也才能更有針對性地為用戶提供個性化的服務(wù)。聰明、貼心、智能的AI與集中化的數(shù)據(jù)將會互相促進(jìn)、互相強(qiáng)化，也就是越集中的數(shù)據(jù)帶來越聰明的AI，越聰明的AI將會通過多渠道收集到更多的個人數(shù)據(jù)。

3.3.1 對于個人信息安全的注重

AI將會使用個人的數(shù)據(jù)進(jìn)行訓(xùn)練并改進(jìn)行為，這需要符合監(jiān)管要求，遵循個人數(shù)據(jù)處理的最小化原則，保證用戶的知情權(quán)，進(jìn)行節(jié)點隔離以及加強(qiáng)對于數(shù)據(jù)處理權(quán)限、存儲、保密的管理。避免個人信息的泄露或者被不當(dāng)使用。

當(dāng)然，這也需要更加完善的數(shù)據(jù)保護(hù)法規(guī)進(jìn)行支撐，比如GDPR、ADPPA、中華人民共和國數(shù)據(jù)安全法、個人信息保護(hù)法等，避免個人隱私泄露。

3.4 人機(jī)深度協(xié)同，構(gòu)建信任變得更重要

越是使用頻繁的、形成依賴的產(chǎn)品，越需要得到用戶的信任。如果微信在使用過程中時不時的出現(xiàn)bug，發(fā)給A的消息錯發(fā)給了B，那么用戶就會變得不敢使用。尤其AI產(chǎn)品還需要收集用戶的各種數(shù)據(jù)才能更好地發(fā)揮作用，那么得到用戶的信任將顯得更加重要。

信任來源于了解、確定、可控，由于AI的黑盒性質(zhì)以及產(chǎn)品越來越主動，如何解釋AI的決策過程、規(guī)范AI的行為、提高AI行為的可預(yù)測性、保持用戶的掌控感也越來越重要。

解釋決策過程和規(guī)范行為并不是說需要AI事事作說明、匯報，而是當(dāng)用戶想要了解時提供詳細(xì)的解釋與說明、當(dāng)用戶想要自己決策時可以修改AI提供的方案。從原則上而言，AI最終還是要服從于人、服務(wù)于人，而不是指揮人、控制人、取代人。

3.5 提前預(yù)判，主動推送，具備主動性

根據(jù)用戶的場景、行為，判斷用戶的意圖，通過多產(chǎn)品、數(shù)據(jù)的貫通，綜合分析，提供事前的提醒與服務(wù)。比如在用戶購買機(jī)票后對接航班、天氣、交通等數(shù)據(jù)，如果有航班管制、惡劣天氣、交通擁堵等不良狀況發(fā)生，可以及時通知用戶。

3.5.1 場景驅(qū)動

信息的集中化處理，使得結(jié)合各種傳感器、設(shè)備所提供的環(huán)境信息以及用戶的生理、行為等信息進(jìn)行綜合分析成為可能。AI可以了解用戶所處的環(huán)境及其需求，通過場景所提供的上下文來減少信息輸入的要求。同時，調(diào)用各個產(chǎn)品的能力，解決問題，減少用戶操作，提高效率與用戶體驗。

比如，智能家庭助手通過手環(huán)檢測到小D躺在沙發(fā)上已經(jīng)睡著，并且有點冷，那么它可能會自動調(diào)小正在播放的音樂、關(guān)閉窗簾、調(diào)暗燈光、打開空調(diào)，讓用戶更加舒適且不會著涼。

3.6 個性化/定制化

由于用戶與產(chǎn)品之間通過一個統(tǒng)一入口來交互，那么用戶的行為數(shù)據(jù)（包括個人的生物信息、健康狀態(tài)、行車路線、購買習(xí)慣、用戶偏好、場所出入數(shù)據(jù)等）將更加全面、完整、準(zhǔn)確被獲取。

通過大量的數(shù)據(jù)與機(jī)器學(xué)習(xí)，讓人工智能可以依據(jù)個人喜好、場景，進(jìn)行意圖判斷。結(jié)合各個產(chǎn)品能力，針對不同用戶可以推薦更加精準(zhǔn)、個性化的內(nèi)容、功能等，也就是說功能也能夠像feed流一樣被推薦，更好地滿足不同人群、場景的需求。

3.6.1 用戶自定義

AI降低了產(chǎn)品/工具操作的門檻，讓更多人可以使用它，也就是所謂技術(shù)的民主化。

這就讓用戶有可能根據(jù)自己的喜好、習(xí)慣、場景等需求差異來配置產(chǎn)品功能組成結(jié)構(gòu)、優(yōu)先級等。就像是洞洞鞋，本身提供一個基礎(chǔ)的樣式，但是每個人可以選擇自己不同的鞋花。未來，也許每個人都可以都可以自己設(shè)計一個APP應(yīng)該具有什么功能、設(shè)計衣服樣式、設(shè)計房子的裝修風(fēng)格等等。

同時，通過社區(qū)、論壇等的信息交流，A設(shè)計的產(chǎn)品也許B可以參考、改進(jìn)后成為屬于自己的產(chǎn)品，每個人都有可能成為生活的創(chuàng)作者，而創(chuàng)作的對象可以包羅萬象。

3.7 改變垂直領(lǐng)域的細(xì)分產(chǎn)品

所有行業(yè)都值得基于人工智能技術(shù)重做一遍——阿里巴巴張勇

AI的生成、總結(jié)、提取、分類等能力的突破，將進(jìn)一步促進(jìn)各行業(yè)中各類信息的整合與利用，接手重復(fù)性的工作，給各行各業(yè)帶來流程的簡化、模式的轉(zhuǎn)變、效率的提升。

針對如殘障人士、老人、小孩等特殊群體，可以開發(fā)提供陪伴、照顧等功能的AI機(jī)器人。
針對律師、醫(yī)生等特定職業(yè)的人員，利用AI輔助進(jìn)行資料收集、數(shù)據(jù)分析等，增強(qiáng)他們的能力，提升工作的效率。
針對生產(chǎn)線、倉庫等目標(biāo)和任務(wù)相對固化的場景，也可以引入AI來替代很多重復(fù)性等工作。比如利用無人超市模式來管理倉庫出庫，領(lǐng)用人員刷臉后自動確認(rèn)領(lǐng)料單，同時系統(tǒng)在領(lǐng)料人員拿走物品后自動進(jìn)行出庫處理、更新庫存數(shù)據(jù)，在庫存不足時對接采購系統(tǒng)進(jìn)行采購等。

4 AI能力加持后，產(chǎn)品的交互邏輯變化

4.1 信息架構(gòu)的變化

GUI模式下基于點擊的輸入，需要將頁面內(nèi)容、功能分門別類進(jìn)行組織、布局，以方便用戶理解與查找然后觸發(fā)，所以信息需要按照邏輯歸類，可尋性也是信息架構(gòu)關(guān)注的重點之一。

AI能力加持下的對話式交互，讓用戶只需要面對一個統(tǒng)一的入口，通過這個入口直達(dá)任意一個功能（類似于Deeplink）。信息的結(jié)構(gòu)不再是以用戶快速找到為中心，而是以讓AI快速調(diào)取為導(dǎo)向。不再是由人去穿越層層結(jié)構(gòu)尋找所需信息，而是所需的信息從紛繁復(fù)雜的數(shù)據(jù)中跳脫出來。

4.1.1 功能架構(gòu)扁平化

通過AI直接調(diào)起產(chǎn)品中的某一個頁面，模塊的功能更加獨立、內(nèi)聚，成為一個個能力單元，產(chǎn)品則成為能力單元的橫向集合。

如果是窄而深的信息架構(gòu)，層層嵌套的模式，那么能力之間可能會有一定的耦合與依賴，被直接調(diào)起時容易缺失上下文，導(dǎo)致功能不可用。

4.1.1.1 導(dǎo)航的弱化

直接調(diào)起的模式，用戶直達(dá)功能。比如對AI說【我想聽李健的《給你》】，它會直接打開播放器，播放這首歌。而不再需要我們【打開音樂APP-找到并點擊搜索框-輸入并搜索-點擊播放】這樣一步一步操作。

減少了尋找信息的步驟，也就減少了導(dǎo)航的需求。導(dǎo)航頁的價值將會降低，以往功能之間需要合理組織以方便用戶記憶、尋找的特征將會減弱。

4.1.2 信息模塊化

功能變成類似于API或者組件的形式，可以根據(jù)需要與其他產(chǎn)品的信息隨意拼裝，成為整體信息流的一部分。就像我們在小紅書看一個個的筆記，或者在淘寶瀏覽一個一個的商品，功能也被拆解為一個一個的單元，在場景需要的時候與其他的功能拼裝形成一個解決方案。

同時，從整體而言，每個產(chǎn)品可能只提供整個信息集合的其中一個部分。也就是前面的說的產(chǎn)品邊界被打破。

4.1.3 拓展性更強(qiáng)

每個頁面都有可能成為首頁，都是信息架構(gòu)的頂部，這需要產(chǎn)品的信息架構(gòu)有很強(qiáng)的兼容性和擴(kuò)展性。——《AI改變設(shè)計》

按照前述AI Agent的設(shè)想，AI所涉及的任務(wù)可能包含多個層級的復(fù)雜度，需要不同能力的配合才能完成，也就是需要依賴不同的產(chǎn)品、組件所提供的能力。

產(chǎn)品的每個功能將類似于樂高的一個積木零件，便于互相組合，目的是容納更多新的功能。同時AI直達(dá)功能的能力可以弱化過寬的信息架構(gòu)所帶來的尋找信息不方便的問題。

4.1.4 用完即走

用戶以任務(wù)目標(biāo)為導(dǎo)向，不在乎是哪個產(chǎn)品、哪個功能，關(guān)鍵在于高效。就像我們不會關(guān)注手機(jī)包裝盒里的充電器是哪個代工廠生產(chǎn)的。產(chǎn)品/能力會“透明化”“無形化”，這些能力的提供方將會成為AI Agent所對接的“供應(yīng)商”。比如小D想聽李健的《給你》，內(nèi)容有可能是QQ音樂提供的、也有可能是網(wǎng)易云音樂提供的、或者是B站一個李健的音樂會視頻，對用戶而言，聽歌的目的達(dá)到了就行。

4.2 交互范式的變化

技術(shù)的革新會引起范式的變遷。最終指向的都是越來越簡單、方便、自然，都是圍繞著更好地服務(wù)于人而來的。

4.2.1 人機(jī)交互的發(fā)展歷程：

批處理（Batch Processing）
命令行交互（Command-based Interaction）
圖形界面交互（Graphical User Interfaces,GUI）
對話式交互（Conversational User Interface,CUI）/語音用戶界面（Voice User Interface,VUI）/語言用戶界面（Language User Interface,LUI）
自然界面交互（Natural user interface,NUI ）/基于意圖的結(jié)果規(guī)范化（Intent-Based Outcome Specification ）

前三種都屬于用戶向計算機(jī)發(fā)出命令，計算機(jī)嚴(yán)格執(zhí)行命令并產(chǎn)生結(jié)果，用戶評估結(jié)果逐步調(diào)整輸入，最終一步一步達(dá)成目標(biāo)。

對話式交互，本質(zhì)也和之前的幾種范式一樣，人發(fā)出命令，計算機(jī)執(zhí)行命令，只是用戶的輸入方式更加多樣化，不止是依賴于當(dāng)前界面所呈現(xiàn)的元素與選項。（圖形界面相對于命令行，也是在輸入輸出方式上變得更豐富，鼠標(biāo)、觸控、手勢等輸入方式以及圖形、動畫等輸出方式減少了用戶的認(rèn)知負(fù)擔(dān)、記憶負(fù)擔(dān)、操作負(fù)擔(dān)）

而在高級階段自然界面交互/基于意圖的的結(jié)果規(guī)范化中，用戶不再需要去適應(yīng)計算機(jī)，而是計算機(jī)來適應(yīng)人，去理解人的表情、手勢、語言、語氣、點擊、生理數(shù)據(jù)等等方式/渠道所傳遞的信息。用戶也不再告訴計算機(jī)要做什么，而是告訴計算機(jī)他們想要的結(jié)果，或者，計算機(jī)能夠通過感知周圍環(huán)境，主動識別用戶的意圖并自動達(dá)成其目標(biāo)。

類似于前文提到過的AI Agent，能夠依據(jù)目標(biāo)分解復(fù)雜的工作流程，從而實現(xiàn)大語言模型的自我對話與運轉(zhuǎn)，而不是簡單地執(zhí)行單一任務(wù)或者由人類來驅(qū)動任務(wù)的每一步。

人機(jī)交互發(fā)展歷程

4.2.2 對話式交互

交互本質(zhì)上是信息的交流，包含信息的輸入與輸出。人與現(xiàn)有產(chǎn)品的交互，輸入的形式包括鼠標(biāo)、鍵盤、觸屏手勢、語音、拍照識別、掃碼等。而輸出的內(nèi)容則包括視覺（文字、圖片、視頻、燈光等）、聽覺（語言、報警音等）、觸覺（震動）。

人與人之間最自然的交流方式通常是語言交流，通過言語表達(dá)思想、感情和意圖。除了語言，人們還通過非語言的方式進(jìn)行交流，如面部表情、姿勢、手勢、眼神等。這些非語言元素可以傳達(dá)豐富的信息，有時比言語更直觀和強(qiáng)烈。這是我們整個成長過程中一種主要的學(xué)習(xí)形式。

對話式交互，就像是人與人之間聊天的交互方式，輸入的途徑可以是文字，也可以是語音、圖片、鏈接、手勢等。Sora甚至可以使用視頻作為輸入來生成視頻。

4.2.2.1 對話式交互的特點

用戶的輸入沒有邊界

擺脫了按鈕、輸入框等的限制，用戶的輸入可能五花八門，甚至與產(chǎn)品的主要功能無關(guān)。功能“無形”之后，就需要針對各種場景給出不同的反饋。

打破產(chǎn)品邊界、跨越信息層級

入口統(tǒng)一，交互路徑縮短，能夠穿透信息層級、跨越產(chǎn)品的業(yè)務(wù)界限。我們的交互過程基于語言的形式輸入，然后回答的形式根據(jù)內(nèi)容而變?？梢越Y(jié)合所個產(chǎn)品、領(lǐng)域的數(shù)據(jù)，綜合給出答案。也就是說，我們不用面對數(shù)量繁多的應(yīng)用/產(chǎn)品，只需要像使用Siri一樣，和一個統(tǒng)一的AI Agent溝通，然后由它來調(diào)取各個產(chǎn)品的能力來為我們提供服務(wù)。

4.2.2.2 對話式交互的場景

任務(wù)式設(shè)計——高效

專業(yè)化的應(yīng)用/工具。針對具體的業(yè)務(wù)領(lǐng)域、任務(wù)類型提出需求。輸入一般具有邊界、比較集中。產(chǎn)品的目的是盡快達(dá)成用戶的目標(biāo)。

閑聊式設(shè)計——有趣

娛樂型的應(yīng)用/伙伴。用戶沒有明確的目標(biāo)，跟隨情緒變化。輸入一般沒有邊界，可能包含任何主題。產(chǎn)品的目的是在對話過程中逐步滿足用戶的情感需求。

4.2.2.3 對話式交互的原則

提供引導(dǎo)，鼓勵用戶輸入

如果開始對話之后遲遲沒有輸入，則提供猜測、默認(rèn)選項、參考示例等，讓用戶直接點選、引導(dǎo)用戶輸入，避免用戶在空無一物的前提下不知道如何開展對話。

特別是在閑聊式場景下，通過打招呼來引導(dǎo)、提示等讓對話可持續(xù)。

理解語境

在我們?nèi)粘５膶υ捴?，很多信息是大家的【共識】，是彼此之間交流的信息基礎(chǔ)，無需在對話中特意說明。

比如對話【Q：今天的天氣怎么樣？A：哪里的天氣？】。這其中位置信息一般都是基于當(dāng)前對話所在的位置或者上下文出現(xiàn)的位置信息來決定的，也就無需用戶再次說明。

在AI的對話設(shè)計中，也就需要理解這些語境信息，減少信息輸入的數(shù)量要求，提高溝通的效率。

記住上下文

上下文包括用戶之前的操作、輸入、用戶的背景信息等，記住上下文并運用到之后的對話之中多輪對話的基礎(chǔ)。一方面可以保證話題的連貫性，一方面也避免用戶的重復(fù)輸入。

具有包容性，消除歧義

語言表達(dá)會有不同的語氣或者表達(dá)方式，語音識別也會有錯誤的情況，這時候要像谷歌搜索一樣，給出合理的猜測并回答，減少用戶二次輸入的成本。

當(dāng)用戶的輸入有歧義時，實用多級置信度的方式給出最匹配的、最有可能的回答，并進(jìn)一步詢問且允許用戶修改。

簡潔、清晰、保證表達(dá)質(zhì)量

簡明扼要，陳述與話題相關(guān)的信息，避免模糊晦澀的表達(dá)。不管以何種形式來反饋，陳述的都是有效的事物，而不是無意義的答案。比如這樣的對話【Q：你知道有哪些人獲得了2023年諾貝爾獎嗎？A：知道?！烤秃翢o意義。

合適的信息量，采用多種信息輸出模式

不多不少，恰到好處的信息含量。面對一個問題，網(wǎng)絡(luò)上相關(guān)的信息可能千千萬。需要結(jié)合實際產(chǎn)品、場景、用戶屬性等實際情況，給出合理、有效的回答。

我們大腦能處理的信息量是有限的，一旦超出，就會對短期記憶造成負(fù)擔(dān)。在某些場景下，語音可以提高效率。但是語音輸出的一個弊端是：聽清并理解語音中的信息，需要耗費我們大腦的資源，而且語音播放之后就消失了，也加重了用戶的記憶負(fù)擔(dān)。

所以不能只依賴于語音的輸出方式，也不僅僅依賴于當(dāng)前的輸出渠道。采用視頻、圖片、聲音等多種形態(tài)的輸出方式甚至跨終端的輸出渠道（比如某些場景在手表輸入在手機(jī)、電視顯示反饋結(jié)果等），可以極大地豐富我們反饋的多樣性、提高信息傳達(dá)的效率，避免用戶需要在不同端之間來回處理信息。

照顧人類情緒，保持禮貌，具備服從指令的屬性

比如這樣的對話【Q：可以朗誦一首唐詩嗎？A：不可以】會讓人覺得別扭、受挫。

如果無法做到，也應(yīng)該表達(dá)歉意并且說明愿意來安慰用戶。比如【A：不好意思，當(dāng)前網(wǎng)絡(luò)狀態(tài)不可用，請檢查網(wǎng)絡(luò)設(shè)置后再次嘗試吧】

話輪轉(zhuǎn)換

對話是一種相互合作，必須有來有回，實用的對話讓對話雙方知道該誰說話。

設(shè)定用戶的期望，讓用戶知道什么時候可以輪換到自己、輸入是否生效等。方法包括隱性確認(rèn)（在回答時帶上用戶提供的信息）、非語言確認(rèn)（使用燈光、圖像、震動、提示音等進(jìn)行反饋）等。

4.2.2.4 VUI/LUI

VUI，Voice User Interface，語音用戶交互界面。LUI，Language User Interface，語言用戶交互界面。是基于語音/語言作為輸入與輸出的交互方式。

嚴(yán)格來說，VUI/LUI是對話式交互形態(tài)之一。因為對話式交互的核心在于一來一回的對話，輸入輸出的可能并不只有語音、文字，可以容納更多的內(nèi)容形式。

對話式交互

優(yōu)點

自然流暢、學(xué)習(xí)成本足夠低。因為對話是從我們出生開始就伴隨我們的交流方式，對話式的交互和人與人之間的溝通相似，無需教學(xué)就會使用。
從輸入效率的角度而言，語音輸入比鍵盤打字的速度更快。
解放雙手，在雙手被占用的情況下，可以拓展交互的渠道。
語音中包含語氣、語調(diào)、語速等情緒性信息，如果能夠識別這些附屬的信息，也就拓寬了信息接收的渠道。
減少對于導(dǎo)航的依賴，減少用戶的記憶負(fù)擔(dān)、認(rèn)知負(fù)擔(dān)

缺點

視覺通道和聽覺通道的信息融合要優(yōu)于單獨的視覺通道和聽覺通道。對于多步驟、多字段的操作，如果完全依賴于對話式交互，所需的對話次數(shù)將會過多，影響整個動作的效率。這時候就需要用戶意圖預(yù)測、沿用典型模板、結(jié)合其他通道（屏幕點擊、手勢、實體按鈕、位置等）操作等方式來簡化所需的信息量或者多通道融合獲取信息。
容易受到周圍噪音的干擾。
隱私問題，在公共場合使用語音輸入容易泄露隱私或者影響到其他人。
公共場合之下對著手機(jī)說話，有可能會引發(fā)社會恥辱感。所以，新的類型的產(chǎn)品往往需要通過明星效應(yīng)、營銷來形成一種風(fēng)尚，引導(dǎo)人們使用。

4.2.3 NUI

NUI充分利用我們生活在這個世界中獲得的技能，最大限度地減少認(rèn)知負(fù)擔(dān)，從而最大限度地減少對于注意力的分散。（NUIs exploit skills that we have acquired through a lifetime of living in the world, which minimizes the cognitive load and therefore minimizes the distraction.）——Bill Buxton, a principal researcher at Microsoft

自然用戶界面（Natural user interface，NUI）。維基百科對于NUI的描述是人們以最自然的交流方式與機(jī)器互動，使用NUI的計算機(jī)不需要鍵盤或鼠標(biāo)。

相比于傳統(tǒng)的GUI或者當(dāng)下比較火熱的CUI，NUI更強(qiáng)調(diào)【自然】，也就是以符合人類直覺的方式與計算機(jī)溝通。不局限于某一種交互方式，而是依據(jù)場景選擇最合適的交互方式。比如在自己家里，使用語音與智能音箱交互。在圖書館，使用觸控、手勢與智能手表交互。

NUI最大的核心是以人為中心，讓用戶可以使用生活中已經(jīng)習(xí)得的技能、經(jīng)驗以及已有的心理模型來與計算機(jī)交互，極大地減少學(xué)習(xí)成本。因為人與外界的自然交流本身是多通道的，包含視覺、聽覺、觸覺、嗅覺、味覺，也就決定了NUI注定是多模態(tài)的。

4.2.3.1 不完全依賴于語音

因為聲音稍縱即逝、難以回溯。完全依賴于語音輸入與輸出的交互方式需要占用用戶大量的注意力，而我們的注意力往往有限，長時間的注意力集中非常消耗人的精力，從而降低了交互的準(zhǔn)確性、影響交互的效率。同時長時間占用用戶的主要注意力，也讓用戶無法同時做其他的事情。

對話式交互主要改變的是輸入方式與使用路徑，與現(xiàn)有豐富的、多模態(tài)的反饋形式結(jié)合，可以有效提升人機(jī)交互的效率。除聽覺反饋以外，輸出方式可以是視覺（指示燈、圖片、視頻等）、觸覺（震動、溫度變化等）。

隨著AI在語音識別、語義理解等方面能力的進(jìn)步，自然對話的形式已成為AI產(chǎn)品的主流交互形式。就目前的情況而言，AI還難以捕捉并解讀我們的面部表情、姿勢、眼神等這些非語言、情緒化、視覺化的信息。

相信未來，隨著各種傳感器、算法模型的不斷演進(jìn)，在我們與機(jī)器對話時，它不僅能聽懂我們的話語，也能結(jié)合我們的面部表情、姿勢、手勢、眼神等綜合分析。至少在輸入端，讓人與機(jī)器的交互逐漸靠近人與人的交互。有可能就像圖靈所預(yù)測的，我們難以分辨和我們對話的到底是一個人還是一臺機(jī)器。

4.2.3.2 VUI+GUI

未來的人工智能系統(tǒng)很可能會擁有混合用戶界面，結(jié)合了基于意圖和基于命令的界面元素，同時保留許多圖形用戶界面元素。——Jakob Nielsen

凡事皆具兩面性。不同交互形式的目的都是為了減少用戶的認(rèn)知負(fù)擔(dān)、操作負(fù)擔(dān)、記憶負(fù)擔(dān)，不是為了用個用。結(jié)合用戶、場景、設(shè)備等特點，選用不同的交互形式結(jié)合，最大化地方便用戶才是最優(yōu)解。

4.2.3.3 多模態(tài)交互

多通道融合交互/多模態(tài)交互，包括語音、面部表情、手勢、各類傳感器所檢測到的生理信息等都可以作為輸入通道，既可以是用戶主動發(fā)起的，也可以是產(chǎn)品主動獲取的。輸出則可以結(jié)合視覺、聽覺、觸覺、味覺和嗅覺多種模態(tài)。核心是圍繞情境選擇合適的交互模式，目標(biāo)是自然、高效。

優(yōu)勢：

多模態(tài)融合不僅是為了符合用戶自然的操作習(xí)慣，也可以增加信息的處理效率。就像在聽演講時，如果演講者結(jié)合PPT進(jìn)行圖示化說明，就更容易、更快速地讓人理解。
多模態(tài)交互充分調(diào)動人的五感，結(jié)合AR、VR、MR等技術(shù)，將數(shù)字世界與物理世界有機(jī)結(jié)合，可以提供更好的真實感、臨場感、沉浸感。
減少對于個人能力的要求，讓老人、殘疾人等特殊群體也可以輕松、便捷地使用，踐行通用設(shè)計的原則，促進(jìn)社會的和諧。

4.2.3.4 基于意圖的結(jié)果規(guī)范化（Intent-Based Outcome Specification ）

這是雅各布·尼爾森提出的一種新的交互范式，詳見：https://www.nngroup.com/articles/ai-paradigm/

以前是設(shè)計產(chǎn)品的能供性（Affordance）來引導(dǎo)用戶操作，比如按鈕代表可點擊?，F(xiàn)在是計算機(jī)要來理解人的意符（Signifiers），比如抬起手臂，手機(jī)自動點亮屏幕，因為它猜測你可能需要開始使用手機(jī)。

NUI側(cè)重于交互方式的自然化，基于意圖的結(jié)果規(guī)范化側(cè)重于對于用戶意圖的反應(yīng)。一個是方式，一個是目的，二者的核心都是讓計算機(jī)圍繞人來進(jìn)行改變，減少人們對認(rèn)知負(fù)擔(dān)、記憶負(fù)擔(dān)、操作負(fù)擔(dān)，提高人的效率，豐富人的生活。

4.3 交互特征的變化

4.3.1 交互層級的壓縮

功能架構(gòu)更加扁平對應(yīng)的就是交互層級的壓縮。通過對話直接調(diào)起某個特定的功能，不需要在一層一層的功能結(jié)構(gòu)中去尋找。每一個動作都是直達(dá)目的，減少了很多尋找功能過程中的過渡操作。

4.3.2 界面的減少

一方面，NUI結(jié)合多種輸入輸出方式，不再單純依賴于界面的呈現(xiàn)，語音、提示音、燈光、震動等多種形式的反饋會替換部分界面的反饋。另一方面，對話式的交互減少了很多承載功能的頁面如導(dǎo)航頁、工作臺等。

4.3.2.1 按鈕的減少

按鈕是基于界面存在的，目的在于觸發(fā)一個動作。一方面，卡片等元素本身可以充當(dāng)按鈕。另一方面，NUI帶來的多模態(tài)交互，點擊屏幕操作將會減少，對按鈕的需求也相應(yīng)的減少了。

4.3.3 主動交互增加

產(chǎn)品不再只是被動的接受信息，而是可以通過多模態(tài)感知主動獲取信息，并依據(jù)用戶設(shè)定的目標(biāo)、對于用戶的了解進(jìn)行自主決策并觸發(fā)下一步的動作，不再需要每一個任務(wù)都由用戶來觸發(fā)。比如汽車在檢測到到用戶遠(yuǎn)離車輛時自動鎖車。智能音箱會在天氣預(yù)報有雨時提醒用戶出門記得帶傘。

主動交互減少了用戶的操作負(fù)擔(dān)，提高了人機(jī)協(xié)同的效率，也讓產(chǎn)品顯得更加貼心。

4.3.3.1 分析用戶的意圖

用戶的行為數(shù)據(jù)、個人習(xí)慣與偏好等通過AI Agent這個統(tǒng)一的交互入口被全面、完整、準(zhǔn)確地獲取，結(jié)合AI Agent所記憶的上下文信息以及各種傳感器所獲取到的場景信息，對用戶意圖對分析將更加準(zhǔn)確。也就是可以通過預(yù)測用戶的下一步行為，主動提前幫助用戶完成。有點類似于想要喝水的時候，杯子里總是有溫度適宜的水。

4.4 AI的“人設(shè)”

4.4.1 人設(shè)是什么

人設(shè)是指用戶在與AI產(chǎn)品互動過程中，根據(jù)感知到的信息（虛擬形象、文本或者語音中的語氣、語調(diào)、音色、情緒等）將AI對象人格化后所建立的一種對于AI的角色形象認(rèn)知。比如，掃地機(jī)器人在電量不足時，發(fā)出語音：“沒能量啦，我要回去吃飯了。”在用戶詢問“你在哪里”時，回應(yīng)“我在這里”。都可以讓人感覺到它是一個有溫度、有感情的個體而不是一個冰冷的機(jī)器。這是一種心理上的簡化行為，避免“恐怖谷”效應(yīng)。

人設(shè)使得產(chǎn)品的個性更加鮮明、突出，用戶與產(chǎn)品交互時能夠獲得“伙伴感”以及交流的愉悅感，有助于拉近產(chǎn)品與用戶之間的心理距離。

4.4.2 人設(shè)設(shè)定的原則

4.4.2.1 一致性

角色的設(shè)定要與產(chǎn)品/內(nèi)容的屬性一致。比如法律、政治新聞等嚴(yán)肅性內(nèi)容，就不適合使用呆萌、可愛的角色。

作為服務(wù)于人類的產(chǎn)品，在于用戶對話時，應(yīng)該保持前后一致、穩(wěn)定的形象。如果前后的回答反差太大會讓人覺得產(chǎn)品出錯了。

4.4.2.2 有禮貌

同時要注意禮貌。比如要及時回答用戶的問題，不能敷衍了事，不能指責(zé)用戶。即便用戶苛刻、生氣，角色也應(yīng)該體現(xiàn)出禮貌、謙遜、關(guān)懷。

4.4.2.3 情感性

感知到人類的情緒，并給出恰當(dāng)?shù)摹Ⅲw貼的回應(yīng)。用戶因此而與產(chǎn)品之間形成情感依戀，增強(qiáng)整體的使用體驗。

4.4.2.4 幽默性

使用象征、諷喻、雙關(guān)等手法，讓人感受到愉悅、有趣，給予用戶類似真實的社交體驗。使AI的形象更加靈活、生動、富有人情味，而不再是冰冷的機(jī)器。

4.4.2.5 個性化

針對不同的用戶特征（年齡、職業(yè)等），也可以針對性地提供不同的角色設(shè)定。

4.4.3 人設(shè)性格的體現(xiàn)方式

聲音的音色、語速、節(jié)奏、表述的方式/語氣、頭像都能體現(xiàn)出AI的性格特征。

4.4.4 人設(shè)性格的設(shè)定方法

與品牌/產(chǎn)品人設(shè)設(shè)定的方法類似，使用情緒板moodboard，結(jié)合商業(yè)目標(biāo)、產(chǎn)品目標(biāo)來發(fā)散人設(shè)的關(guān)鍵詞，比如客戶希望以什么形容詞來描述產(chǎn)品、用戶喜歡什么樣的人設(shè)。然后通過篩選、整合，選擇最具有代表性的形容詞，以可視化的方式呈現(xiàn)。然后與Persona類似，固化名字、職位、年齡、性別、行為習(xí)慣、愛好等特征。

人設(shè)設(shè)定好以后，所有的行為（語氣、語速、表達(dá)方式等）、外觀（表情、頭像、虛擬形象等等）都圍繞人設(shè)，從而強(qiáng)化這一形象在用戶心中的印象。并在用戶測試中優(yōu)化迭代。

5 AI能力加持后，產(chǎn)品設(shè)計應(yīng)該注意的原則

目前比較系統(tǒng)的提出AI產(chǎn)品設(shè)計原則都有MicroSoft、Google、SAP、IBM幾家公司（原文檔見文后參考鏈接）?？傮w而言，設(shè)計原則中不變的是以人為本的核心，變化的是如何以人為本、如何更好地以人為本。

5.1 明確傳遞系統(tǒng)可以做什么

做出說明、給出推薦等，幫助用戶明白 AI 系統(tǒng)能夠幫助自己解決何種問題。

提供框架與制約因素，引導(dǎo)用戶迅速展開行動，避免用戶在面對完全空白的頁面時，腦海中思緒過多且無法集中，不知從何著手。

5.1.1 說明系統(tǒng)能做到多好

幫助用戶了解AI系統(tǒng)犯錯的頻率，讓用戶對產(chǎn)品形成合適的預(yù)期。使用諸如【我們認(rèn)為你可能會喜歡】來介紹推薦的音樂，會讓人更能包容錯誤。

5.2 基于具體場景和時間提供服務(wù)

根據(jù)用戶當(dāng)前的任務(wù)和環(huán)境判斷何時該觸發(fā)行為或中斷行為。

比如檢測到用戶在行走過程中，手表自動記錄步數(shù)。假設(shè)用戶剛剛查詢過去往目的地的路線，則自動進(jìn)入步行導(dǎo)航模式。比如當(dāng)時間為半夜時，語音助手在回答問題時主動降低音量。

5.2.1 記住前后文

記住用戶最近的交互行為。保持短期記憶并允許用戶高效引用。比如用戶說：搜索【歌手李健】，在AI給出結(jié)果后，用戶說：播放他的歌曲。這時候產(chǎn)品就應(yīng)該播放李健的歌曲而不是再次詢問用戶播放誰的歌曲。

5.2.1.1 顯示與上下文相關(guān)的信息

顯示與用戶當(dāng)前任務(wù)和環(huán)境相關(guān)的信息。比如用戶詢問【天氣情況】時，在結(jié)果中表明是今天、當(dāng)前位置的天氣情況。

5.2.2 記住關(guān)于用戶的信息

記住用戶的個人偏好、行為習(xí)慣等，主動推送/建議，減少用戶的重復(fù)操作。類似于登錄之后的個性化推薦。

5.2.2.1 從用戶的行為中學(xué)習(xí)

不斷學(xué)習(xí)用戶過往的操作來個性化用戶體驗，與用戶建立更加親密的聯(lián)系。類似于推薦算法，推薦的是用戶感興趣、可能會用到的功能、信息。比如用戶總是在每天的同一時刻打開同一個APP，iPhone會在用戶下次這個時間點解鎖手機(jī)時推薦這個APP。

5.2.2.2 鼓勵用戶反饋

讓用戶能夠在與人工智能系統(tǒng)的定期互動中提供反饋，表明自己的偏好。也就是產(chǎn)品不僅可以主動學(xué)習(xí)用戶的行為，還可以讓用戶主動告訴產(chǎn)品自己喜歡什么、習(xí)慣什么。

5.2.3 機(jī)器主動感知

通過各類傳感器實時感知周圍環(huán)境、人的行為，以此更好地為人類服務(wù)。不需要用戶主動發(fā)出指令，就可以結(jié)合以往的使用習(xí)慣進(jìn)行意圖判斷，主動推送/發(fā)起流程。

5.2.3.1 平靜技術(shù)

交流不是為了體現(xiàn)技術(shù)設(shè)備的能力，而是為了滿足用戶需求。——《交互的未來》

因為人們的注意力是有限的，是一種寶貴的資源。應(yīng)該讓人把注意力放在真正重要的事情上。如果各個產(chǎn)品一直大聲的吆喝，不停地爭奪用戶的注意力，那么重要的事情有可能會被淹沒。

在用戶需要時，能夠及時響應(yīng)甚至提前預(yù)判，提高效率與流暢度。用戶不需要時，不要過多的干擾用戶，避免產(chǎn)品/技術(shù)本身引起太多的注意。類似于微信產(chǎn)品經(jīng)理張小龍之前提出【用完即走】的理念，產(chǎn)品是服務(wù)于人的，不能成為負(fù)擔(dān)，而是要減輕人的負(fù)擔(dān)。

5.3 建立信任、不要讓用戶失去控制感

由于AI的不可解釋性、自主決策，用戶必然會對其有所顧慮。所以讓用戶建立起對于AI的信任感，是人類與AI深度協(xié)同的重要前提。

信任是有粘性的，如果用戶信任一項服務(wù)，可能會選擇一直信任。反之，如果用戶不信任，可能會一直選擇不信任。

信任對于用戶是否會采用至關(guān)重要。不信任會蔓延，一個功能的不信任會影響對于整體或者所有類似產(chǎn)品的不信任。比如Siri就降低了人們對于所有手機(jī)語音助手的信任度。

人類對機(jī)器的信任依賴于可靠性與安全性、可控性、清晰透明、一致性。

5.3.1 可靠性與安全性

要使 AI 系統(tǒng)受信任，它們需要可靠且安全。系統(tǒng)必須像設(shè)計好的那樣運行，并安全響應(yīng)新的情況。其固有的復(fù)原能力應(yīng)能抵御預(yù)期操作或意外操作。

5.3.1.1 準(zhǔn)確、及時

信任由積極的體驗構(gòu)成。頻繁的犯錯、延遲、不可用，讓用戶遭遇多次失敗、挫折，會降低用戶對產(chǎn)品的信心與信任。

與實際的人相比，人們對于機(jī)器犯錯的容忍度更低。

5.3.1.2 用戶數(shù)據(jù)權(quán)利

提供通知和同意的機(jī)制，允許用戶拒絕服務(wù)或數(shù)據(jù)。隱私設(shè)置和權(quán)限應(yīng)該清晰、可查找且可調(diào)整。

充分披露個人信息的使用或共享方式。對數(shù)據(jù)的用途、使用范圍提供詳細(xì)的說明。

用戶應(yīng)始終控制正在使用的數(shù)據(jù)以及選擇在什么情況下使用。他們可以拒絕AI訪問他們認(rèn)為可能會受到損害或不適合人工智能了解或使用的個人數(shù)據(jù)。

保護(hù)用戶的隱私與數(shù)據(jù)安全。當(dāng)個人詳細(xì)信息（例如地址）可能作為人工智能預(yù)測的一部分而暴露時，采取額外措施來保護(hù)隱私（例如，匿名化姓名，即使人們同意使用他們的名字）。保護(hù)個人隱私，遵守機(jī)器人三定律等。

5.3.2 可控性

5.3.2.1 由用戶控制

AI的底層原則是強(qiáng)化人的能力，而不是取代人。輔助用戶決策，簡化用戶的負(fù)擔(dān)。

從簡單、獨立的任務(wù)開始，讓用戶相信、適應(yīng)AI的能力。同時，可以提供預(yù)測、建議，但是應(yīng)該由用戶來做最終的決策。如果產(chǎn)品決策完以后再通知用戶，會讓用戶感覺失去主導(dǎo)權(quán)或者被產(chǎn)品所控制。

當(dāng)用戶提出的訴求有歧義時，給用戶提供選項或者調(diào)整的機(jī)會來逐步明確目標(biāo)。比如用戶說想聽【如愿】這首歌曲，搜索結(jié)果有好幾個版本，這時候讓用戶選擇一個，或者在播放開始時提示用戶可以主動更換。

提供全局控制，允許用戶全局自定義人工智能系統(tǒng)的監(jiān)控內(nèi)容和行為方式。

5.3.2.2 可以輕松的調(diào)用與關(guān)閉

在需要時能夠易于啟用。比如使用【Hi，Siri】來隨時激活iPhone的語音助手。

出錯時能輕松回退、編輯、改進(jìn)或恢復(fù)。能夠隨時退出，類似于安全艙設(shè)計理念。

5.3.3 清晰透明

5.3.3.1 真誠

標(biāo)記AI生成的內(nèi)容，讓用戶心里有數(shù)，保持誠信。

5.3.3.2 可解釋性

清楚地說明系統(tǒng)為什么這樣做。提供解釋說明，讓用戶知曉AI做出決策的原因（一般是基于決策所帶來的好處，當(dāng)用戶對底層技術(shù)感興趣時，通過漸進(jìn)式披露的方式來提供更多詳細(xì)的信息）?；蛘呷绻l(fā)生錯誤，解釋哪里出了問題。

由于AI對于普通用戶來說就像一個黑盒，可解釋性可幫助數(shù)據(jù)科學(xué)家、審核員和業(yè)務(wù)決策者確保 AI 系統(tǒng)能夠證明其決策及其得出結(jié)論的方式，建立公眾對顛覆性技術(shù)的信心，促進(jìn)更安全的實踐，并促進(jìn)更廣泛的社會采用。

可解釋性還有助于確保符合公司政策、行業(yè)標(biāo)準(zhǔn)和政府法規(guī)。

5.3.3.3 通知用戶

謹(jǐn)慎的更新和修改，添加或更新其功能時要通知用戶。在更新和調(diào)整人工智能系統(tǒng)行為時，限制破壞性變化，讓用戶能夠適應(yīng)變化。

傳達(dá)用戶行為的后果，及時更新或傳達(dá)用戶行為將如何影響人工智能系統(tǒng)的未來行為。

5.3.3.4 一致性

一致性讓AI的行為可預(yù)期，有助于用戶建立心智模型，減少因為AI能力黑盒帶來的不可知，增加用戶的掌控感。

5.4 符合社會規(guī)范、減少偏見

5.4.1 公平

錯誤的數(shù)據(jù)會帶來錯誤的認(rèn)知。如果AI預(yù)訓(xùn)練的數(shù)據(jù)中存在偏見，那么AI可能也會產(chǎn)生偏見。

建立倫理道德規(guī)范，減少社會偏見。由于現(xiàn)實世界的數(shù)據(jù)中難免包含帶有種族歧視等社會偏見的意向，需確保人工智能系統(tǒng)的語言和行為不會強(qiáng)化不良和不公平的成見和偏見，特別是那些與種族、民族、性別、國籍、收入、性取向、能力以及政治或宗教信仰等敏感特征相關(guān)的偏見。

5.4.2 國際化/在地化

根據(jù)用戶的社會和文化背景，確保以用戶期望的方式提供體驗。國際化的產(chǎn)品要尊重當(dāng)?shù)氐奈幕?、風(fēng)俗習(xí)慣、宗教信仰等。

5.5 擬人化

社會語言學(xué)家的研究表明即使是極少的語音樣本，也會讓人產(chǎn)生對于演講者性格、形象方面的印象。我們早已進(jìn)化成可以根據(jù)人的聲音來總結(jié)評判別人的專家。——《谷歌是怎么設(shè)計AI語音界面的？這里總結(jié)了對話設(shè)計六大原則》

人與AI的對話式交互，就像人與人之間的交流一樣。用戶能夠這種擬人化的對話中獲得“伙伴感”以及交流的愉悅感，拉近了人工智能與用戶的心理距離，大大降低了用戶使用人工智能的心理抗拒程度，從而形成品牌或產(chǎn)品和顧客間的情感紐帶，強(qiáng)化用戶與該品牌之間的關(guān)系。

6 AI產(chǎn)品發(fā)展過程分析

能力的發(fā)展會推動產(chǎn)品形態(tài)的變革，就像是通信網(wǎng)絡(luò)、智能手機(jī)催生出了無數(shù)的APP，讓微信視頻聊天、實時看直播成為可能一樣。AI能力的發(fā)展也會拓寬AI產(chǎn)品的邊界、豐富AI產(chǎn)品的形態(tài)。

6.1 從能力發(fā)展看

人工智能的主要發(fā)展方向：運算智能、感知智能、認(rèn)知智能。

計算智能：計算智能是人工智能發(fā)展的最初階段，主要是指機(jī)器對信息進(jìn)行存儲和計算的能力。在這個階段，機(jī)器主要進(jìn)行簡單的數(shù)據(jù)處理和計算任務(wù)，缺乏更深層次的理解和學(xué)習(xí)能力。這部分主要是模型計算能力的提升。
感知智能：感知智能是人工智能發(fā)展的第二階段，指機(jī)器具備感知世界的能力，包括視覺、聽覺、觸覺等感知方式。這讓機(jī)器能夠更好地理解周圍環(huán)境和與之進(jìn)行交互，但仍缺乏深層次的思考和推理能力。這部分主要是多模態(tài)感知能力的提升。
認(rèn)知智能：認(rèn)知智能是人工智能發(fā)展的最高階段，指機(jī)器具備類似人類的認(rèn)知能力，包括學(xué)習(xí)、推理、記憶和理解等方面。在這個階段，機(jī)器可以自主地進(jìn)行學(xué)習(xí)和思考，具有更高級的智能表現(xiàn)。這部分主要是模型能夠自主學(xué)習(xí)、調(diào)整、優(yōu)化。

6.2 從產(chǎn)品角度看

6.2.1 一個趁手的工具

利用AI的運算智能、感知智能，在任務(wù)全流程的某一個任務(wù)中引入AI能力，解決各類業(yè)務(wù)場景中出現(xiàn)的問題。或者根據(jù)不同領(lǐng)域、職業(yè)等特定場景，打造垂直領(lǐng)域的AI而不是通用型的解決方案。比如使用人臉識別技術(shù)分析學(xué)生上直播課的表情，判斷學(xué)生的學(xué)習(xí)狀態(tài)，及時提醒老師關(guān)注，促進(jìn)學(xué)生高效學(xué)習(xí)。

人智結(jié)合，任務(wù)還是由人來主導(dǎo)，AI作為像錘子一樣的工具，主要是執(zhí)行指令，成為用戶的助手，提高操作效率，幫助用戶節(jié)省時間。比如內(nèi)容創(chuàng)作平臺的編輯器，可以讓作者利用AI助手優(yōu)化文章表達(dá)，但是沒法從頭到尾寫一篇符合用戶高要求的文章。

圖片來源：unsplash

6.2.2 成為現(xiàn)代“電力”

通過軟硬結(jié)合的形式，連接起各個產(chǎn)品，產(chǎn)品之間借助各自的AI Agent互相溝通，形成統(tǒng)一的生態(tài)。這樣的話，AI就在我們的生活環(huán)境中無處不在，滲透到每一個角落，集成各類行為數(shù)據(jù)進(jìn)行分析，提供綜合、全面、貼心的服務(wù)。比如最常見的智能家居場景，門鎖通過人臉識別為主人開門，同時把客廳的燈打開。用戶坐到沙發(fā)上之后，用語音控制打開電視，客廳的燈光則自動調(diào)整到適合看電視的模式。

圖片來源：unsplash

6.2.3 一個管家/私人助理

認(rèn)知智能讓AI學(xué)會自主預(yù)判、創(chuàng)造、決策，接管人類生活的瑣碎事情。打造個人專屬的AI，借助信息通信，從用戶相關(guān)的每一個產(chǎn)品中獲取信息，綜合分析，幫助用戶做出決策。這個AI助理熟悉用戶方方面面的習(xí)慣，通過用戶的行為分析主動去對接各個產(chǎn)品、能力，從而實現(xiàn)完全的個性化。

比如一個獨居老人，手環(huán)、心臟監(jiān)測裝置等檢測到用戶可能會身體不適，提前通過智能音箱、手機(jī)等提示用戶去往醫(yī)院檢查。用戶乘坐自動駕駛等汽車到達(dá)醫(yī)院后，AI助理已經(jīng)幫助用戶掛號，并將過往的數(shù)據(jù)發(fā)給醫(yī)院的AI醫(yī)生。醫(yī)護(hù)人員根據(jù)AI醫(yī)生的建議，直接安排檢查、治療方案。老人出院后，AI醫(yī)生將醫(yī)囑傳送給老人的AI助理，由它來提醒老人每天按時吃藥。

圖片來源：unsplash

7 AI與現(xiàn)有產(chǎn)品的融合模式分析

從與現(xiàn)有產(chǎn)品的結(jié)合程度而言，大致應(yīng)該是AI部分介入作為輔助——AI主導(dǎo)功能——完全AI化。

7.1 從融合程度看

7.1.1 單點嵌入

在局部增加AI能力，比如嵌入到某一個按鈕中、在原界面增加一個小入口、在評論區(qū)/聊天窗口使用AT等方式呼出AI助理。這樣可以在保持原有用戶習(xí)慣的基礎(chǔ)上逐步培養(yǎng)用戶的習(xí)慣。

需要對場景進(jìn)行細(xì)致地分析，也就是應(yīng)該在什么場景下提示用戶產(chǎn)品所具有的AI能力。比如文檔類產(chǎn)品，可以自動生成文章大綱?；蛘咴谟脩暨x擇一段文字后，編輯菜單中會出現(xiàn)【AI改寫】的入口。

單點嵌入

7.1.2 模塊嵌入

劃分出專門的一塊功能區(qū)，比如頁面增加一個tab、或者做一個獨立的模塊、或者下拉后進(jìn)入AI對話模式。這樣的好處是加入AI后，對原有的頁面影響不大，同時又會比較醒目，讓用戶快速感知。

比如FigJam AI，通過一個懸浮框來引導(dǎo)用戶使用。

Figma界面截圖

7.1.3 半獨立

這種是比較常見的一種方式，好處是不破壞原來的信息結(jié)構(gòu)與頁面布局，可以更快地融入AI能力。比如懸浮操作球作為入口、瀏覽器插件等。

7.1.4 完全獨立

把AI能力打包，作為一個統(tǒng)一入口，可以輔助/調(diào)用所有產(chǎn)品，就像是嵌入AI Agent的PC或者手機(jī)一樣。

這樣AI就不是為了增強(qiáng)某一個產(chǎn)品的能力，而是本身成為一個能力平臺/私人助理，類似于Siri，可以調(diào)用iPhone內(nèi)的各種應(yīng)用。

7.2 從結(jié)合方式看

以下模式只是基于現(xiàn)有狀況對未來發(fā)展方向的一種合理推測與猜想。

7.2.1 軟硬結(jié)合

7.2.1.1 能力平臺

在電腦/手機(jī)中嵌入AI Agent ，就像手機(jī)的語音助手一樣，綜合多模態(tài)交互，直接調(diào)起設(shè)備中的各項能力進(jìn)行響應(yīng)。結(jié)合個人行為數(shù)據(jù)后，不但在對指令的回應(yīng)方面愈發(fā)契合用戶的喜好與習(xí)慣，還可以主動交互，提高生產(chǎn)效率。

比如用戶想要看開心麻花的電影，那么Agent會整合各個應(yīng)用資源供用戶選擇，或者依據(jù)用戶的習(xí)慣直接播放用戶可能感興趣的那一部。

比如在用戶看論文時，默默幫助用戶總結(jié)、整理、收集、分類，用戶看完幾十篇論文后，不僅可以幫助用戶橫向?qū)Ρ?、提取核心觀點，還可以幫助用戶發(fā)現(xiàn)類似的論文。用戶在寫作中引用某一原文時，對應(yīng)生成參考文獻(xiàn)注釋。

7.2.1.2 硬件協(xié)同

AI來協(xié)調(diào)指揮硬件，讓信息在各個產(chǎn)品/設(shè)備之間流動，按照具體場景實現(xiàn)設(shè)備之間關(guān)聯(lián)的貫通，促進(jìn)各個設(shè)備之間的高效合作。

比如家庭助理，協(xié)調(diào)家中的各種電器，在下班到家之前調(diào)好空調(diào)溫度、到家后繼續(xù)通過智能音箱播放在車上收聽的節(jié)目、音樂等。假設(shè)用戶訂好了第二天早上的機(jī)票，那家庭助理會在用戶回到家后提醒用戶收拾行李并且定好第二天早上的鬧鐘。

對于獨居老人而言，可穿戴設(shè)備會實時監(jiān)控老人的身體狀況并提醒老人按時服藥。在老人發(fā)生危險情況時及時撥打急救中心電話并為醫(yī)護(hù)人員開門。

7.2.2 物理世界與數(shù)字世界的融合

結(jié)合各類傳感器，AI可以更全面的收集關(guān)于物理世界的各類信息。同時，利用XR（VR, AR, MR）、具身智能（Embodied Artificial Intelligence）等技術(shù)等發(fā)展，數(shù)字世界也可以直接影響、操縱物理世界。

物理世界的信息、行為將可以通過數(shù)字世界進(jìn)行傳輸，也許未來不僅可以視頻通話看到對方的樣子，還可以遠(yuǎn)程握手、擁抱等，人與人之間通過網(wǎng)絡(luò)的聊天就像是面對面聊天一樣。

7.2.3 數(shù)字孿生

數(shù)字映射（Digital twin），或譯作數(shù)字孿生、數(shù)字分身、數(shù)位雙生，指在信息化平臺內(nèi)模擬物理實體、流程或者系統(tǒng)，類似實體系統(tǒng)在信息化平臺中的雙胞胎。比如在醫(yī)療領(lǐng)域，通過把患者投射成具有生命功能的數(shù)字孿生體，就可以讓AI來模擬患者對于各種藥物的反應(yīng)，從而為患者選擇最好的治療方案。

在科幻電視《黑鏡》中，技術(shù)人員通過抽取用戶的思維，在數(shù)字世界制造一個用戶的分身來作為用戶的私人助理。因為只有自己才最了解自己。

電視劇《黑鏡》劇照

8 我們該怎么做

8.1 AI只是手段，關(guān)鍵在于目的

AI可以執(zhí)行【做】這個過程，它知道要做什么，但是它不知道為什么要這么做。產(chǎn)品的目的、所需要服務(wù)的人群、所產(chǎn)生的價值都是由人來定義的。這些是將所有資源整合起來的核心。不然，只是通過AI生成一堆沒有關(guān)聯(lián)的內(nèi)容，并不能轉(zhuǎn)化為實際的產(chǎn)品或者服務(wù)。

AI可以解決重復(fù)性、規(guī)則性的工作，但是無法共情人類的情感、理解人類情緒、主動創(chuàng)造、做出決策。所以需要人類與AI攜手合作，充分發(fā)揮各自的優(yōu)勢，

8.1.1 結(jié)合AI能力，幫助項目落地

在產(chǎn)品研發(fā)流程中，需要根據(jù)不同的業(yè)務(wù)需求和場景選擇適合的AI技術(shù)，靈活運用AI的能力，將AI技術(shù)融入工作流。

比如目前AI生成的內(nèi)容，就像是一個一個單獨的元件，往往不能拿來直接使用，需要結(jié)合業(yè)務(wù)目的、場景等進(jìn)行調(diào)整、結(jié)合等，達(dá)成業(yè)務(wù)目標(biāo)。就像現(xiàn)在各種設(shè)計組件庫，也需要結(jié)合實際的業(yè)務(wù)場景、需要解決的問題等靈活選用。

8.2 提升綜合能力，成為雪花形人才

雪花型人才是指多元、復(fù)合型人才，圍繞一個核心，在多個領(lǐng)域快速積累知識和經(jīng)驗。知識之間的交叉、經(jīng)驗的遷移、不同行業(yè)之間的借鑒等，有助于快速地給出解決方案、做出決策。

由于AI可以解決很多基礎(chǔ)性、重復(fù)性的工作，拓展個人的能力邊界，提升個人產(chǎn)出的效率。那么人有限的精力可以用來做更多重要的事情，個人的能力將得到更全面的發(fā)展。也就是把以前用來練習(xí)與掌握各種軟件、工具的時間都用于去理解不同領(lǐng)域的知識，并結(jié)合這些知識指導(dǎo)、使用AI進(jìn)行創(chuàng)作與輸出。

雪花型人才

8.2.1 未來已來，只是分布得不均勻

技術(shù)要找到合適的場景，解決問題，適配人性。就像《梁寧-產(chǎn)品思維30講》中所說的：未來已來，只是分布得不均勻。面對問題時，我們可以將多領(lǐng)域知識、經(jīng)驗、技術(shù)、邏輯等遷移互鑒，拓寬自己的視野，通過類比、聯(lián)想獲得更優(yōu)的解決方案。

這需要跨領(lǐng)域的學(xué)習(xí)能力，或者說快速熟悉某一個領(lǐng)域的能力，以及系統(tǒng)性思維。利用AI的快速總結(jié)能力，秉持終身學(xué)習(xí)的理念，將知識橫向連接，最終成為一個具有自己獨特見解的問題解決者。

8.2.2 提升軟實力

8.2.2.1 對于世界的好奇心

好奇心引領(lǐng)人類前行。AI是解決問題的工具，而人類則通過提出問題來拓展知識疆域的邊界。愛因斯坦曾說：“提出一個問題往往比解決一個問題更為重要。”提出一個好問題，往往意味著對事物有著濃厚的興趣、深入的思考、敏銳的洞察。在科學(xué)研究中，一個具有創(chuàng)新性和前瞻性的問題可能會引發(fā)一系列的研究和探索，從而推動整個領(lǐng)域的發(fā)展。

好奇心是自驅(qū)的動力。對未知充滿好奇，可以提升我們的自我批判能力，助力于我們探索新的未知的領(lǐng)域、拓寬我們的思維邊界，而不是僅僅滿足于當(dāng)前已有的模式。

8.2.2.2 保持人性

AI主要是根據(jù)已有的數(shù)據(jù)、信息進(jìn)行分析或預(yù)測，而人類的想象力、直覺、情感等可以幫助人類“無中生有”，創(chuàng)造那些不曾存在過的新事物。

信息不發(fā)生串聯(lián)、關(guān)聯(lián)、形成網(wǎng)絡(luò)，則只是數(shù)據(jù)，而不能稱之為知識。AI可以幫我們快速、準(zhǔn)確地找到各類信息與資源，但是讓這些信息轉(zhuǎn)變?yōu)閭€人的知識與智慧，還需要人類自我的認(rèn)知、分析、整合、思考的努力后形成自己的觀點與理解。

同時，我們能夠運用批判性思維來質(zhì)疑和驗證所接收到的信息，保持自我的獨立性，從而避免盲目接受。

8.2.2.3 溝通能力

所有產(chǎn)品終究都是要為人所服務(wù)的，與人溝通、了解人的需求、確定我們要解決的問題，是確立產(chǎn)品目標(biāo)的關(guān)鍵。而產(chǎn)品目標(biāo)是決定我們要做什么、以及怎么做的指導(dǎo)原則，是整個產(chǎn)品的方向與旗幟。只有產(chǎn)品目標(biāo)明確，產(chǎn)品才有可能獲得成功。

人與AI相比的一大優(yōu)勢是具有同理心，能夠理解人類的情緒、情感，這在與人溝通中發(fā)揮著關(guān)鍵作用，可以設(shè)身處地為他人著想，理解他們的感受和觀點，從而分析與理解他們沒有直接表達(dá)出來的某些想法。

在溝通中建立信任、鞏固情感、平衡各方利益，與上下游合作推進(jìn)方案落地，是除了產(chǎn)出設(shè)計方案以外更加重要的能力。

8.2.2.4 對于業(yè)務(wù)的理解

只有深入理解業(yè)務(wù)，才能真正知曉用戶在業(yè)務(wù)流程中的痛點和期望，從而設(shè)計出能切實解決問題、提升用戶體驗的產(chǎn)品。

很多B端產(chǎn)品，特別是金融類、法律合規(guī)類的產(chǎn)品，由于現(xiàn)實情況、規(guī)則制定多樣化的原因，往往有很多復(fù)雜業(yè)務(wù)場景限制，這些規(guī)則由人制定而且互相牽扯，AI 可能需要大量的訓(xùn)練數(shù)據(jù)和時間來學(xué)習(xí)和適應(yīng)。

同時，評估這些規(guī)則對于產(chǎn)品的影響，也需要多維度的梳理，并針對性的解決，確保產(chǎn)品的合規(guī)性和穩(wěn)定性。

8.3 在目前的產(chǎn)品研發(fā)流程中，如何使用AI提效？

就目前的階段而言，人工智能更像是一個趁手、高效的工具。所以我們使用AI提效的總體原則是：在產(chǎn)品研發(fā)流程的不同階段，選取有價值的環(huán)節(jié)、AI比較擅長的部分，利用AI來強(qiáng)化能力、提高效率。

比如可以使用AI提高我們的搜索效率、助力我們快速獲取各類資源，或者輔助我們進(jìn)行一些發(fā)散、總結(jié)、提煉等方面基礎(chǔ)性的思維創(chuàng)造工作，從中獲取一些設(shè)計靈感與方向。

或者使用AI為決策過程增加視角的多樣性?；贏I所擁有的不同領(lǐng)域的背景知識，當(dāng)我們向AI尋求建議時，等于有各種類型的專業(yè)人士意見可供參考。

8.3.1 產(chǎn)品規(guī)劃

描述產(chǎn)品的目的、場景、用戶等，由AI給出一定的產(chǎn)品設(shè)計思路參考，包括對于產(chǎn)品業(yè)務(wù)流程的優(yōu)化、模塊分類、頁面布局等。

8.3.2 信息架構(gòu)

在組織信息時，可以讓 AI 扮演不同的角色，如用戶、管理員等，提供類似卡片分類測試的結(jié)果以供參考。

8.3.3 提供靈感

在設(shè)計的雙鉆模型中，當(dāng)具體需要解決的問題明確以后，一般需要進(jìn)行創(chuàng)意探索與方案發(fā)散。這時候可以利用AI所掌握的海量數(shù)據(jù)與遠(yuǎn)超人類的計算能力，快速嘗試各種風(fēng)格進(jìn)行對比，探索各種類型的風(fēng)格感覺。對于視覺要求度高的運營設(shè)計而言，能夠極大程度地縮減前期風(fēng)格探索所需的時間。

8.3.4 尋找&生成各類資源

增強(qiáng)搜索能力，進(jìn)行資源整合或者生成一些符合業(yè)務(wù)場景的資源。包括不限于競品、分析報告、情緒版、設(shè)計組件庫、產(chǎn)品相關(guān)知識（業(yè)務(wù)、心理學(xué)、設(shè)計等）、行業(yè)數(shù)據(jù)、展示模板樣機(jī)、插畫、宣傳海報等。

8.3.4.1 生成設(shè)計元素

使用Midjourney等AI圖像生成工具，生成如icon、logo、頭像、虛擬人物、背景、banner、運營活動宣傳插圖等視覺元素。比如QQ音樂的不同播放器風(fēng)格，就是AI生成的。

8.3.4.2 AIGC豐富產(chǎn)品

產(chǎn)品中的一些內(nèi)容資源，也可以加入AIGC內(nèi)容。例如電商應(yīng)用中的模特圖片、數(shù)字人虛擬主播、可以發(fā)表話題的虛擬用戶、可以在群聊/評論區(qū)隨時出現(xiàn)的AI助理等。這樣，可以使平臺內(nèi)容更加豐富、多樣化，以吸引更多的用戶參與和交流。

8.3.5 優(yōu)化文案

對文案表達(dá)進(jìn)行潤色、優(yōu)化表達(dá)方式、檢查錯別字等，包括不限于內(nèi)容示例、說明引導(dǎo)文案、反饋提示文案、產(chǎn)品的簡介、銷售文案、各平臺的運營文案、Slogan等。

8.3.6 提煉重點、分析數(shù)據(jù)、撰寫材料

把資料整理、數(shù)據(jù)處理這一類重復(fù)性的工作交給AI。比如設(shè)計調(diào)研后，由AI來產(chǎn)出數(shù)據(jù)分析報告并總結(jié)、產(chǎn)品匯報階段用AI先擬定一個初步的PPT大綱、在用戶測試階段用AI幫助制定測試計劃、在宣傳策劃階段讓AI撰寫視頻腳本等。然后設(shè)計師再結(jié)合AI初步整理的材料進(jìn)行細(xì)化與完善。

8.3.7 提供決策依據(jù)

設(shè)計方案完成后，需要對不同的方案進(jìn)行比對、測試、驗證等。傳統(tǒng)的用戶測試常需要花費大量的人力、時間、金錢成本。使用AI進(jìn)行初步的分析總結(jié)，選擇一種方案上線并在后續(xù)迭代中不斷優(yōu)化，也許是另一種輕量化的解決思路。

9 最后

世界上唯一不變的是變化，我們唯一能做的就是擁抱它。

技術(shù)是產(chǎn)品實現(xiàn)的重要基礎(chǔ)，技術(shù)的變革會導(dǎo)致產(chǎn)品的形態(tài)發(fā)生改變。因而所有行業(yè)都有可能被AI改造一遍，包括不限于：生產(chǎn)制造、教育、法律、影視傳媒、游戲、醫(yī)療等等。這些改變將是業(yè)務(wù)層面的變革。

人性是產(chǎn)品需求的重要基礎(chǔ)，人性不變，需求則不變，改變的只是實現(xiàn)需求的方式。技術(shù)的發(fā)展應(yīng)該服務(wù)于人類的利益，無論技術(shù)如何演進(jìn)，歸根結(jié)底仍需以人本為核心，而不是僅僅追求技術(shù)本身的進(jìn)步。也就是產(chǎn)品以技術(shù)作為實現(xiàn)手段，圍繞著提高人類生活質(zhì)量、實現(xiàn)人類終極自由的目標(biāo)而前進(jìn)。

藍(lán)藍(lán)設(shè)計(sillybuy.com )是一家專注而深入的界面設(shè)計公司，為期望卓越的國內(nèi)外企業(yè)提供卓越的大數(shù)據(jù)可視化界面設(shè)計、B端界面設(shè)計、桌面端界面設(shè)計、APP界面設(shè)計、圖標(biāo)定制、用戶體驗設(shè)計、交互設(shè)計、UI咨詢、高端網(wǎng)站設(shè)計、平面設(shè)計，以及相關(guān)的軟件開發(fā)服務(wù)，咨詢電話：01063334945。我們建立了一個微信群，每天分享國內(nèi)外優(yōu)秀的設(shè)計，有興趣請加入一起學(xué)習(xí)成長，咨詢及進(jìn)群請加藍(lán)小助微信ben_lanlan。

« 超全面陰影設(shè)計指南圖標(biāo)設(shè)計的進(jìn)化歷程，讀這一篇就好了！ »

AI時代新篇章：用戶體驗設(shè)計的智能革命與未來展望

1 AI相關(guān)概念與術(shù)語

1.1 AI&AIGC

從其工作的機(jī)制而言，目前主要分為兩種：決策式人工智能，生成式人工智能。

從能力角度而言，人工智能也可以分為強(qiáng)人工智能和弱人工智能。

1.2 AI Agent

1.2.1 人類與AI協(xié)作的三種模式：

1.2.2 AI Agent是什么

1.3 AI的算法

1.3.1 AI的三大流派

1.3.1.1 符號主義：

1.3.1.2 連接主義：

1.3.1.3 行為主義：

1.3.2 目前主流的算法：

1.3.2.1 神經(jīng)網(wǎng)絡(luò)（Neural Network）

1.3.2.2 生成式對抗網(wǎng)絡(luò)（Generative Adversarial Networks, GAN）

1.3.2.3 Transformer模型：

1.3.3 自然語言處理（Natural Language Processing, NLP）

1.3.4 機(jī)器學(xué)習(xí)（Machine Learning, ML）

1.3.4.1 深度學(xué)習(xí)（ Deep Learning）

1.3.4.2 監(jiān)督學(xué)習(xí)（Supervised Learning）

1.3.4.3 無監(jiān)督學(xué)習(xí)（Unsupervised Learning）

1.3.4.4 強(qiáng)化學(xué)習(xí)（Reinforcement Learning）

1.3.5 大語言模型（Large Language Model, LLM）

2 AI能力分析

2.1 人類能力地形圖

2.1.1 人類相比于AI，所擁有的優(yōu)勢：

2.1.2 AI相比于人類，所擁有的優(yōu)勢：

2.2 發(fā)揮各自最大的優(yōu)勢

3 AI能力加持后，產(chǎn)品/業(yè)務(wù)層面變化

3.1 產(chǎn)品邊界變得模糊

3.1.1 物理世界與數(shù)字世界深度融合

3.1.2 產(chǎn)品成為能力中心

3.1.3 服務(wù)設(shè)計

3.1.4 流程自動化

3.1.5 B/C端差異減少

3.1.6 多產(chǎn)品形態(tài)互聯(lián)互通

3.2 接受非結(jié)構(gòu)化的信息

3.2.1 普適計算（ubiquitous computing）

3.3 數(shù)據(jù)的集中化處理

3.3.1 對于個人信息安全的注重

3.4 人機(jī)深度協(xié)同，構(gòu)建信任變得更重要

3.5 提前預(yù)判，主動推送，具備主動性

3.5.1 場景驅(qū)動

3.6 個性化/定制化

3.6.1 用戶自定義

3.7 改變垂直領(lǐng)域的細(xì)分產(chǎn)品

4 AI能力加持后，產(chǎn)品的交互邏輯變化

4.1 信息架構(gòu)的變化

4.1.1 功能架構(gòu)扁平化

4.1.1.1 導(dǎo)航的弱化

4.1.2 信息模塊化

4.1.3 拓展性更強(qiáng)

4.1.4 用完即走

4.2 交互范式的變化

4.2.1 人機(jī)交互的發(fā)展歷程：

4.2.2 對話式交互

4.2.2.1 對話式交互的特點

4.2.2.2 對話式交互的場景

4.2.2.3 對話式交互的原則

4.2.2.4 VUI/LUI

4.2.3 NUI

4.2.3.1 不完全依賴于語音

4.2.3.2 VUI+GUI

4.2.3.3 多模態(tài)交互

4.2.3.4 基于意圖的結(jié)果規(guī)范化（Intent-Based Outcome Specification ）

4.3 交互特征的變化

4.3.1 交互層級的壓縮

4.3.2 界面的減少

4.3.2.1 按鈕的減少

4.3.3 主動交互增加

4.3.3.1 分析用戶的意圖

4.4 AI的“人設(shè)”

4.4.1 人設(shè)是什么

4.4.2 人設(shè)設(shè)定的原則

4.4.2.1 一致性

4.4.2.2 有禮貌

4.4.2.3 情感性

4.4.2.4 幽默性

4.4.2.5 個性化

從其工作的機(jī)制而言，目前主要分為兩種：決策式人工智能，生成式人工智能。

從能力角度而言，人工智能也可以分為強(qiáng)人工智能和弱人工智能。

2.1.1 人類相比于AI，所擁有的優(yōu)勢：

2.1.2 AI相比于人類，所擁有的優(yōu)勢：

3.5 提前預(yù)判，主動推送，具備主動性

5 AI能力加持后，產(chǎn)品設(shè)計應(yīng)該注意的原則

5.3 建立信任、不要讓用戶失去控制感

5.3.1.1 準(zhǔn)確、及時

8.1 AI只是手段，關(guān)鍵在于目的

8.3 在目前的產(chǎn)品研發(fā)流程中，如何使用AI提效？

8.3.6 提煉重點、分析數(shù)據(jù)、撰寫材料