作者: Boxu Li

準備好體驗便利的 AI 嗎?試試這個用 Macaron :「設計一個包含 10 分鐘專注時間塊、溫柔計時器,以及一鍵完成的三步驟晨間流程。」 看看一個 ADHD 友好的日常如何能啟動你的一天——一切都通過一個懂得無障礙是內建而非附加的個人 AI。

對於個人 AI 來說,無障礙性不是「可有可無」的,而是基本需求。一個真正的個人 AI 必須滿足每位用戶的需求,無論他們是 ADHD、閱讀障礙、視力低下,或是連接有限。在這篇文章中,我們探討了Macaron AI如何為神經多樣性和多模態生活而設計,超越檢查框,提供包容性的智能服務給所有人。

為什麼無障礙性是個人 AI 的核心(而非可有可無)

包容性設計不僅僅是道德的要求,更是自稱「個人化」的 AI 所必需的。世界上有很大一部分人是神經多樣化的,但許多數位體驗仍然迎合一個神話中的「平均」用戶。例如,估計有 五分之一的孩子有學習障礙,這使得處理書面文字變得困難,並且將近 10% 的美國孩子被診斷出患有 ADHD(我們中間可能還有許多未被診斷的成年人)。如果一個個人化的 AI 僅僅對神經典型、完全健全的用戶有效,那它就失去了個人化的意義。與其期望用戶適應軟體,不如讓 AI 適應每位用戶的認知和感官檔案——從大眾用戶體驗轉向個人化認知。

從大眾用戶體驗到個人化認知

傳統的「一刀切」用戶體驗常讓神經多樣性用戶感到沮喪。個人化 AI 翻轉了這個劇本:它不斷學習並適應的思考和工作方式。前瞻性的研究人員預測,AI 驅動的界面將很快能夠即時適應用戶的無障礙偏好,並在數位產品中變得幾乎無處不在。實際上,這意味著如果你在專注方面有困難,你的 AI 可以將任務分解為小步驟;如果亮屏觸發感官超載,它可以默認為平靜的高對比度主題。目標是認知契合:你的 AI 應該在你所在之處與你相遇(而不是相反)。最終,為神經多樣性的極端情況設計最終改善了所有人的用戶體驗——正如微軟的沉浸式閱讀器通過幫助閱讀障礙學生而證明,隨後成為數百萬普通用戶所喜愛的一樣。

標準與超越(WCAG 順從作為基礎,個性化作為差異化)

符合 Web 內容無障礙指南(WCAG)等無障礙標準是必要的起點,但真正的個人化 AI 更進一步。WCAG 專注於一般最佳實踐——色彩對比、文本替代、鍵盤導航——並提供穩固的基礎。然而,僅僅遵從標準並不能保證對於 ADHD 或自閉症患者來說的無障礙體驗。例如,WCAG 可能要求為視頻添加字幕或為圖片提供替代文字,但它並不保證內容是以簡單的語言撰寫,或介面不會造成認知負擔。Macaron 將 WCAG 2.1 視為基本要求,然後加入個性化層次。可以想像標準的無障礙功能如斜坡和欄杆——Macaron 當然也具備這些功能。但它還會隨著時間的推移學習每個用戶的獨特需求,有效地成為個人無障礙助手。一個符合指導方針但仍然僵化的介面是不夠的;它應該為每個人量身定制並靈活應對。正如一家設計公司所說,「無障礙合規是起點,但真正的包容性需要更深入地理解用戶需求。」

為神經多樣性設計的 Macaron

神經多樣性涵蓋了如注意力不足過動症(ADHD)、自閉症、閱讀障礙等狀況,每一種都有不同的挑戰和優勢。為神經多樣化用戶設計 Macaron 意味著要同時擁抱靈活性、結構性和清晰性。我們借鑒包容性設計研究和認知科學,創建能減少認知負荷的流程,同時讓用戶保持掌控。以下,我們強調一些內建於 Macaron 設計中的神經多樣性友好模式。

ADHD 友好的流程(短步驟、時間框定、提示、視覺進度)

對於患有 ADHD 的用戶,冗長無結構的任務和無盡的選項可能令人感到麻痺。Macaron 通過將互動結構化為專注且短小的步驟來解決這個問題——基本上遵循「一屏、一任務」的原則以避免過載。Macaron 不會一次性給你一個龐大的表單或 10 個步驟的流程,而是將工作流程分解為可管理的塊,並提供明確的下一步行動。這樣創造了一種動量感(正如一位患有 ADHD 的設計師所指出的,點擊「下一步」時能帶來一點小成就感,讓你繼續前進)。Macaron 還採用了時間框定技術:例如,你可以要求它為某個任務設置一個 10 分鐘的專注計時器,或者它可能建議「我們花 5 分鐘來頭腦風暴,然後休息一下」——利用了常被推薦給 ADHD 的時間管理策略。

溫和的提醒和提示是另一個內建功能。健忘是 ADHD 常見的障礙,因此 Macaron 會在任務或截止日期成為危機前不著痕跡地提醒您。這些不是一般的通知,而是上下文感知的提示(例如,在您上午例行活動中,微妙地「👍 完成了 3 個步驟中的 2 個,繼續加油!」)。為了保持動力,Macaron 還使用視覺進度指標——從簡單的清單勾選完成的步驟到隨著工作流程推進而填滿的進度條。研究表明,像進度條或紙屑特效這樣的獎勵性視覺反饋可以幫助 ADHD 使用者保持專注,並看到他們正朝著目標前進。簡而言之,Macaron 的 ADHD 友善流程是有結構但不壓抑:它提供護欄來保持專注,同時慶祝每個小勝利以維持動力。

讀寫障礙者友好的呈現(可讀性、間距、可選簡化模式)

文字密集的內容對於有閱讀障礙的使用者來說可能帶來重大挑戰。因此,Macaron 的用戶介面經過調整,以達到最大的可讀性。預設情況下,我們使用簡潔的無襯線字體(如 Helvetica 或 Arial),避免使用難以辨認的風格化或斜體字。更重要的是,Macaron 提供了一個閱讀障礙模式切換,將內容重新格式化為對閱讀障礙者友好的設定。啟用此模式後,字母間距和單詞間距將增加到建議的水平(研究表明,更寬的間距—大約多 35% 的字母間距和單詞間距的 3.5 倍—能顯著提高閱讀障礙者的可讀性)。當啟用閱讀障礙模式時,我們也會禁用連字和華麗的字體設計,因為有時甚至一個合併的「fi」字符也可能讓讀者困惑。目標是減少文字的「視覺擁擠」,讓每個字母和單詞有更多的呼吸空間。

除了字體之外,Macaron 還可以調整內容的佈局和複雜性,以適應有閱讀障礙或其他偏好簡單內容的讀者。例如,它可以提供長篇文件或電子郵件的簡化摘要。利用其大型語言模型,Macaron 可以將複雜的文本重新措辭成用戶閱讀水平的簡單語言,而不降低其意義。這種按需文本簡化不僅僅是便利,對許多用戶來說是至關重要的。僅在德國,就有1000 萬至 1700 萬人面臨嚴重的閱讀挑戰,而全球有 16% 的成年人(約 7.59 億人)缺乏基本的讀寫能力。對他們來說,充滿術語的文件可能是難以逾越的障礙。Macaron 的解決方案是一個個人閱讀助手,可以自動簡化或解釋內容。如果您收到一份密集的法律通知或學術文章,可以請 Macaron 將其「翻譯」成日常語言。結果是以對話、簡潔的風格呈現的內容,讓更廣泛的受眾能夠理解——這是「簡單語言」的實際應用。重要的是,這一功能也對其他人有益(忙碌的人群想快速掌握要點,非母語人士等)。個性化意味著您可以根據喜好調整文本的複雜度——這一功能遠遠超越了靜態的無障礙指南。

感官適應模式(減少運動、高對比、安靜的用戶體驗)

感官敏感性是神經多樣性的一個方面,Macaron 會積極配合。一些使用者(包括許多自閉症譜系或前庭障礙者)可能會因為過多的螢幕運動和炫目的動畫而感到不適甚至噁心。在 Macaron 中,動畫和效果預設為最小化,並且提供一個全域的*「減少運動」*設定,去除任何非必要的動作(可以想像成 iOS 的「減少運動」設定,但應用於 AI 的網頁和應用介面)。我們也尊重使用者的作業系統層級偏好——如果你的裝置設定為偏好減少運動,Macaron 會自動降低效果。同樣地,對於視覺對比和顏色,為低視力使用者提供高對比模式,使用深色主題、粗體文字和清晰的指示(這對於在強光下或低品質螢幕上的任何人都有益)。Macaron 的所有圖示和顏色提示都使用色盲友好的調色板設計,並至少通過 WCAG AA 對比合規測試。

Macaron 也提供一種「靜音模式」,適合需要低干擾、低刺激體驗的人。啟用時,靜音模式將關閉非關鍵通知和聲音,必要時使用輕柔的觸覺反饋或柔和的鈴聲,並隱藏與當前任務無關的介面元素(如側邊欄或裝飾圖片)。這類似於許多人覺得有幫助的「專注模式」——就像在介面上戴上降噪耳機。通過隱藏非必要的內容和音頻,Macaron 的靜音 UX 模式為敏感用戶創造了一個平靜的工作空間。正如設計師所指出的,即使是神經典型用戶也經常欣賞這樣的選擇——有時你會想要一個無干擾的體驗。在所有情況下,原則是將控制權交給用戶:亮度、對比度、字體大小、動作、聲音——每個感官方面都可以調整。這種適應性確保 Macaron 在動力不足時足夠刺激,或在用戶超負荷時保持冷靜穩定。

多模式,因為生活是多模式的

你的生活不是單一模式——你交談,你發短信,你觀看,你聆聽。那麼為什麼你的個人 AI 要被限制在單一的互動模式中呢?Macaron 是為了與你以你當下最舒適或便利的方式互動而設計的。有些人不喜歡「打字」,更喜歡說話;其他人可能依賴於視覺效果或需要每段音頻的文字記錄。擁抱多模態設計不僅僅是一個花哨的附加功能,而是可及性的必需品。正如 AI 思想領袖所觀察到的,下一代界面將整合語音、視覺和手勢與文本一起,讓用戶以靈活且符合情境的方式互動。以下是 Macaron 如何將多模態引入個人助手:

語音優先互動(免手動提示,確認回路)

語音是一種強大的模式,特別適合雙手忙碌、視力不佳或只是更容易通過聆聽處理信息的用戶。Macaron 擁有強大的語音優先介面:你可以通過語音輸入與它對話,它會以自然的聲音回應你。這可不是你那笨拙的舊電話樹系統——而是一個能理解上下文的對話代理。舉例來說,當你在烹飪時,你可能會說:「嘿 Macaron,把大蒜加到我的購物清單上,並設置一個 5 分鐘的意大利麵計時器。」它會以語音確認每個操作(「已添加大蒜。計時器已設置為 5 分鐘。」),讓你知道它正確理解了——這些確認環節對於避免使用語音時的誤解至關重要。我們從語音用戶體驗研究中了解到,清晰的確認以及通過語音取消或撤銷的能力是良好免手操作體驗的關鍵(沒有人希望 AI 做錯事情而不檢查就繼續下去)。

語音互動在許多領域顯著提升了無障礙環境。它們可以幫助行動不便的人(不需要滑動或打字,如果這很困難的話),並且可以降低某些用戶的認知負荷——說出一個請求比導航複雜的圖形界面更直觀。值得注意的是更廣泛的趨勢:語音助手已經每天被數億人使用,並且它們為先前因傳統介面而感到困難的人打開了技術的門。例如,有視力障礙的人可以使用 Macaron 的語音模式來操作應用程式、發送訊息或獲取資訊,而無需查看螢幕。在教育領域,語音技術也顯得非常有價值:大約 20% 的學齡兒童有閱讀困難,語音學習工具讓他們可以通過聽取內容吸收知識,或通過說話而不是寫作來回應。Macaron 的語音優先設計與此相符——它是一種平等化工具,讓你可以自然地互動。無論是在駕駛時發出命令(免提),還是你只是喜歡說話勝過打字,AI 都能適應你的需求。此外,如果你有語音差異或口音,Macaron 不斷學習你的聲音;加上像伊利諾伊大學的「語音無障礙計畫」這樣的持續項目,正在改善語音識別,以更好地服務於具有非典型語音模式的用戶,我們也一直在關注這些動向。

圖像和文件理解(提取可操作項目;總結為用戶的閱讀水平)

Macaron 的另一個強項是 視覺 —— 不僅僅是輸出圖像或圖表,而是真正理解您提供的視覺輸入。生活充滿了視覺信息:照片、截圖、掃描的 PDF、幻燈片、產品標籤,應有盡有。Macaron 能夠分析這些信息,幫助您從中獲得意義和行動。例如,您可以拍下郵寄信件或約會卡的照片,然後問 Macaron:「我需要怎麼處理這個?」使用 OCR 和視覺 AI,它將讀取文本、進行解釋,並回應類似:「看起來您有一個牙醫約會,時間是 6 月 5 日上午 10 點。我已將其添加到您的日曆並設置了提醒。」這不僅僅是簡單的描述——而是提取可操作的信息。它也可以用於表格(例如「在這裡簽名,並在週五前寄給您的 HR」)或更日常的任務,如當您找不到眼鏡時讀取包裝上的成分。

視障或低視力用戶可以從 看到 並描述世界的 AI 中受益。Macaron 利用類似 Be My Eyes 的「Be My AI」功能的計算機視覺,提供快速、生動的圖像描述,甚至回答有關它們的後續問題。這樣一來,個人 AI 可以作為隨時可用的視覺解釋器,無論是閱讀標誌、識別物體,還是用簡單的中文總結圖表。

能夠將內容總結到特定的閱讀水平也是一項突破。我們討論了 Macaron 如何簡化文字來幫助閱讀障礙者;這一功能也適用於您遇到的任何文件或網頁。您可以將學術論文或長篇新聞文章提供給 Macaron,然後說:「給我一個 8 年級閱讀水平的簡短總結」──它將以清晰、簡單的語言生成一個簡潔的摘要。在背後,它使用先進的基於 LLM 的文本簡化技術,能在保留意義的同時降低複雜性。這對於不僅是有閱讀困難的用戶,甚至對非母語使用者(或坦白說,任何時間緊迫的人)都非常有幫助。考慮到在整個歐洲大約有20-25% 的人功能性文盲,還有更多的人在使用非母語時識字能力有限,這項功能的重要性不容小覷。透過調整模態(將文字轉化為語音,或將密集的文字轉化為簡化的文字和圖像),Macaron 確保您不會因為格式而被信息拒之門外。這是通過翻譯實現的無障礙——在語言之間、在複雜性水平之間,以及在感官模式之間。

預設字幕和文字記錄(適用於音頻/語音輸出)

在多模態 AI 中,音頻輸出很棒——但不是每個人都能輕鬆聽到或處理音頻。這就是為什麼 Macaron 說的或播放的所有內容默認都會以文字形式提供。如果 Macaron 提供語音答案或講述摘要,您將同時在聊天或應用日誌中看到轉錄。這當然有利於聾人和聽障用戶,但在許多情境下也很有用:可能你在安靜的圖書館裡無法播放聲音,或希望稍後快速瀏覽對話。值得注意的是,研究顯示,超過 80% 使用視頻字幕的人並非聽力受損——他們出於便利或因為環境吵雜/安靜而使用字幕。在 Macaron 中,字幕不是事後才想到的;它是內建功能。如果您通過 Macaron 的介面觀看影片或播客(想像一下由 AI 精選的學習播放清單),您可以獲得 自動生成的字幕和完整轉錄,便於跟隨或在其中搜索。我們利用尖端的語音識別模型來確保這些轉錄的高度準確性,並將文本格式化以提高可讀性(例如需要的說話人標籤、時間戳等)。

文字記錄和字幕也能提高許多神經多樣性用戶的理解力,例如,患有多動症的人可能會受益於聆聽AI的解釋,同時閱讀來增強專注力。同樣,非母語人士經常使用文字記錄來核對他們聽到的內容。通過提供這些多模態的冗餘,Macaron全方位覆蓋。這符合通用設計中的多重呈現原則:以不同形式呈現信息以適應不同的偏好。而且更進一步:Macaron的文字記錄是可搜索和可導出的,因此您可以查看上週AI告訴您的內容,甚至獲得過去會話的摘要(我們知道,這很超前!)。最重要的是,如果有任何音頻輸出,等效的文字就會在那裡——用戶不應該需要尋找或詢問。在無障礙環境中,這就是做好基本工作的方式:字幕和文字記錄確保沒有人被排除在口語內容之外。正如第508條指南所指出的,文字記錄不僅僅是為有聽力損失的人準備的,它們同樣幫助語言學習者和處於嘈雜或安靜環境中的任何人。Macaron完全擁抱這一點。

Boxu 在埃默里大學獲得了定量經濟學專業的學士學位。在加入 Macaron 之前,Boxu 的職業生涯大部分時間都在美國的私募股權和風險投資領域度過。他現在是 Macaron AI 的首席參謀和市場營銷副總裁,負責管理財務、物流和運營,並監督市場營銷。

申請成為 Macaron 的第一批朋友