画像

著者: Boxu Li

アクセスしやすいAIを体験する準備はできましたか?Macaronで試してみましょう:「10分間の集中ブロック、優しいタイマー、ワンタップで完了する3ステップのモーニングフローを作成」。ADHDに優しいルーチンがどのように一日をスタートさせるのかを体感してください。すべては、アクセシビリティが「組み込まれている」個人AIのおかげです。

アクセシビリティは個人AIにとって「あると良いもの」ではなく、基本です。真に個人的なAIは、ADHD、ディスレクシア、低視力、または限られた接続性を持つユーザーのニーズに応じて柔軟に対応する必要があります。この投稿では、Macaron AIがどのように神経多様性と多モーダルな生活のために構築され、チェックボックスを超えてすべての人に包括的なインテリジェンスを提供するかを探ります。

アクセシビリティが個人AIの核である理由(「あると良いもの」ではない)

インクルーシブデザインは倫理的であるだけでなく、「パーソナル」であると主張するAIにとって不可欠です。世界の多くは神経多様性を持っているにもかかわらず、多くのデジタル体験は依然として架空の「平均的」ユーザーに合わせています。例えば、5人に1人の子どもが学習障害を持ち、文字を処理するのが難しいとされています。また、アメリカの子どもの約10%がADHDと診断されており、未診断の成人も多くいると考えられます。個人的なAIが神経典型的で完全に健常なユーザーにしか対応できない場合、それはパーソナルであることに失敗しています。ユーザーがソフトウェアに適応するのではなく、AIが各ユーザーの認知と感覚プロファイルに適応する必要があります。つまり、大衆向けUXから個別の認識へのシフトです。

大衆向けUXから個別の認識へ

従来の「一律対応」UXは、多様な神経タイプのユーザーをしばしば苛立たせていました。パーソナルAIはこの状況を一変させます:あなたが考え、働く方法に継続的に学習し適応します。先見的な研究者たちは、AI対応のインターフェースが、間もなくユーザーのアクセシビリティの好みにリアルタイムで適応し、デジタル製品全般に広く普及するだろうと予測しています。実際、集中力に困難を感じる場合、AIがタスクを小さなステップに分けることができますし、明るい画面が感覚過負荷を引き起こす場合には、落ち着いた高コントラストのテーマをデフォルトに設定することができます。目標は「認知的適合」です:あなたのAIはあなたの状況に寄り添うべきであり、逆ではありません。最終的に、神経多様性の極端な状況に対応してデザインすることが、全てのユーザーにとってUXを向上させることになります。これは、マイクロソフトのイマーシブリーダーがディスレクシアの学生を助け、その後、多くの一般ユーザーに愛されるようになったことで証明されました。

標準とその先へ (WCAG準拠を基礎として、個別化を差別化要因に)

Webコンテンツアクセシビリティガイドライン(WCAG)などのアクセシビリティ基準を満たすことは必要な出発点ですが、本当のパーソナルAIはそれ以上を目指します。WCAGは一般的なベストプラクティスに焦点を当てています。例えば、色のコントラスト、テキストの代替、キーボードナビゲーションなどで、しっかりとした基盤を提供します。しかし、単なる遵守だけでは、ADHDや自閉症のある人にとって感じるアクセシブルな体験を保証するものではありません。例えば、WCAGはビデオのキャプションや画像の代替テキストを義務付けるかもしれませんが、内容が平易な言葉で書かれているか、インターフェースが認知的に過度に負担をかけないかは保証しません。MacaronはWCAG 2.1を基本とし、そこから個別化の層を積み重ねます。標準的なアクセシビリティ機能をスロープや手すりと考えてください。Macaronには確かにそれがあります。しかし、それは時間をかけて各ユーザーのユニークなニーズを学び、個人的なアクセシビリティアシスタントとなるのです。ガイドラインに準拠しているが硬直的なインターフェースでは不十分です。個々のユーザーに合わせて柔軟に変化するべきです。あるデザインエージェンシーが言ったように、「アクセシビリティの遵守は出発点であり、本当の包括性にはユーザーのニーズを深く理解することが必要です。」

ニューロダイバーシティに対応したMacaronのデザイン

神経多様性は、ADHD、自閉症、失読症などの状態を含み、それぞれに異なる課題と強みがあります。Macaronを神経多様性を持つユーザー向けに設計することは、柔軟性、構造、明瞭性を同等に重視することを意味します。包括的なデザインリサーチと認知科学を取り入れ、ユーザーがコントロールを保ちながら認知負荷を軽減するフローを作成します。以下に、Macaronのデザインに組み込まれた神経多様性に配慮したパターンのいくつかを紹介します。

ADHDに優しいフロー(短いステップ、タイムボックス、促し、視覚的進捗)

ADHDを持つユーザーにとって、長く無構造なタスクや無限の選択肢は麻痺を引き起こすことがあります。Macaronは、インタラクションを集中した短いステップに構造化することでこれに対処し、過負荷を避けるために「1画面1タスク」のルールに従います。大きなフォームや10ステップのプロセスを一度に提示するのではなく、Macaronはワークフローを管理しやすい部分に分け、次のアクションを明確にします。これにより、勢いが生まれ(ADHDのデザイナーが指摘したように、「次へ」をクリックすると小さな達成感を得て前進できる)、Macaronはタイムボックス技法も採用しています。例えば、タスクのために10分の集中タイマーを設定するように依頼したり、「5分間ブレインストーミングしてから休憩しましょう」と提案したりすることで、ADHDに推奨される時間管理戦略を活用します。

優しい促しとリマインダーは、もう一つの組み込み機能です。忘れっぽさはADHDの共通の課題なので、Macaronはタスクや締め切りを、危機になる前にさりげなく思い出させてくれます。これらは一般的な通知ではなく、コンテキストに応じたプロンプトです(例: 朝のルーチン中に「👍 3ステップ中2ステップ完了、頑張って!」といったさりげないもの)。モチベーションを維持するために、Macaronは視覚的な進捗インジケーターも使用します。完了したステップをチェックするシンプルなチェックリストから、ワークフローが進むにつれて満たされていく進捗バーまで、様々です。研究によれば、進捗バーや紙吹雪の演出のような報酬的な視覚フィードバックは、ADHDのユーザーが関与し続け、自分が目標に向かっていることを実感するのに役立つとされています。要するに、MacaronのADHDに優しいフローは、構造的でありながら窮屈ではない: 集中力を維持するためのガードレールを提供し、小さな勝利を祝うことで勢いを持続させます。

ディスレクシアに配慮したプレゼンテーション(読みやすさ、間隔、オプションの簡易モード)

テキストが多いコンテンツは、読み書き障害を持つユーザーにとって大きな課題となることがあります。そこで、MacaronのUIは最大限の読みやすさを実現するように調整されています。デフォルトでは、ヘルベチカやArialのようなクリーンなサンセリフフォントを使用し、解読が難しいスタイライズされた文字やイタリック体を避けています。さらに重要なことに、Macaronには「ディスレクシアモード」というトグル機能があり、このモードを有効にすると、ディスレクシアにやさしい設定でコンテンツが再フォーマットされます。このモードをアクティブにすると、文字間隔と単語間隔が推奨レベルまで広がります(研究によれば、文字間隔を約35%増やし、単語間隔をその3.5倍にすることで、ディスレクシアの読者にとって読みやすさが劇的に向上するとのことです)。また、ディスレクシアモードがオンのときは、合字や派手なタイポグラフィを無効にしています。「fi」のような合字さえも、読者を戸惑わせることがあるためです。目標は、テキストの「視覚的な混雑」を減らし、各文字と単語により多くの余白を与えることです。

タイポグラフィを超えて、Macaronはコンテンツのレイアウトと複雑さを失読症の読者やシンプルさを好む他の読者向けに調整できます。例えば、長い文書やメールの簡略化された要約をオプションで提示することが可能です。Macaronはその大規模言語モデルを使用して、複雑なテキストをユーザーの読解レベルに合わせた平易な言葉に言い換えますが、意味を薄めることはありません。このようなオンデマンドのテキスト簡略化は単なる便利さではなく、多くのユーザーにとって重要です。例えば、ドイツだけでも**1,000万~1,700万人が深刻な読解の課題を抱えており、世界中の成人の16%(約7億5,900万人)は基本的な識字能力を欠いています。**彼らにとって、専門用語が詰まった文書は越えられない壁となることがあります。Macaronの答えは、コンテンツを自動的に簡略化または説明できる個人的な読書アシスタントです。もし密度の高い法律通知や学術論文を受け取った場合、Macaronにそれを日常的な言葉に「翻訳」するよう頼むことができます。結果として得られるのは、より広い読者層が理解しやすい会話的で簡潔なスタイルで提示されたコンテンツです。これは「平易な言葉」の実用的な応用です。重要なことに、この機能はほかの人々(要点を素早く知りたい忙しい人々、非ネイティブの話者など)にも利益をもたらします。パーソナライズによって、テキストの複雑さを好みに応じて調整することができ、これは静的なアクセシビリティガイドラインを超えた差別化要素です。

感覚適応モード(動きの削減、高コントラスト、静かなUX)

感覚過敏は神経多様性のもう1つの側面であり、マカロンは積極的にそれに対応しています。ユーザーの中には(自閉症スペクトラムや前庭障害を持つ多くの人を含む)、過度の画面上の動きや派手なアニメーションに圧倒されたり、場合によっては吐き気を感じたりすることがあります。マカロンでは、アニメーションやエフェクトはデフォルトで最小限に抑えられており、グローバルな*「動きを減らす」*設定により、不要な動きをすべて取り除きます(iOSの「動きを減らす」設定のように、AIのインターフェースに適用されます)。また、ユーザーのOSレベルの設定も尊重します。デバイスがmotionの削減を優先するように設定されている場合、マカロンは自動的に演出を抑えます。同様に視覚コントラストと色も同様で、高コントラストモードが低視力のユーザー向けに利用可能で、暗いテーマに太字のテキストと明確なインジケーターが使用されます(これは明るい日光の下や低品質の画面上でも有効です)。マカロン内のすべてのアイコンと色の手がかりは、色覚異常に優しいパレットで設計され、最低でもWCAG AAのコントラスト準拠でテストされています。

Macaronは、低刺激で気が散らない体験を求める方のために「クワイエットモード」も提供しています。有効にすると、クワイエットモードは非重要な通知や音をオフにし、必要なアラートには穏やかな触覚フィードバックや柔らかいチャイムを使用し、現在のタスクに関連しないUI要素(サイドバーや装飾画像など)を隠します。これは多くの人が役立つと感じる「フォーカスモード」に似ており、インターフェースにノイズキャンセリングヘッドフォンをかけるようなものです。非必須のコンテンツや音声を隠すことで、Macaronの静かなUXモードは、敏感なユーザーが作業するための穏やかな空間を作り出します。デザイナーたちは、神経典型のユーザーでさえ、このようなオプションをしばしば評価していると指摘しています。場合によっては、気が散らない体験を求めることもあります。すべての場合において、原則はユーザーにコントロールを与えることです。明るさ、コントラスト、フォントサイズ、動き、音——あらゆる感覚の側面が調整可能です。この順応性により、Macaronはやる気が低いときには刺激を与え、ユーザーが負荷を感じているときには穏やかで安定したものになります。

マルチモーダル、なぜなら人生はマルチモーダルだから

あなたの生活は一つの方法だけで成り立っているわけではありません。話したり、テキストを送ったり、動画を見たり、音楽を聴いたりします。では、なぜあなたのパーソナルAIが一つのインタラクションモードに制限されるべきでしょうか?Macaronは、あなたが最も快適で便利だと感じる方法でやり取りできるように設計されています。中には「テキスト派」でなく、話すのを好む人もいますし、ビジュアルに頼ったり、すべての音声の文字起こしが必要な人もいるかもしれません。マルチモーダルデザインを取り入れることは、単なる華やかな追加機能ではなく、アクセシビリティのための必要性です。AIの思想リーダーたちは、次世代のインターフェースは音声、ビジョン、ジェスチャーをテキストと共に統合し、柔軟でコンテキストに適した方法でユーザーがやり取りできるようになると観察しています。Macaronがどのようにしてマルチモーダルをパーソナルアシスタンスに取り入れているかをご紹介します。

音声優先のインタラクション(ハンズフリープロンプト、確認ループ)

声は非常に強力なモードであり、特に手がふさがっている人や視力が低い人、または単に聞くことで情報をよりよく処理する人にとって便利です。Macaronには堅牢な音声優先インターフェースがあります。音声入力を通じて会話でき、自然な声で応答します。これは古い無骨な電話ツリーシステムではなく、コンテキストを理解する会話エージェントです。例えば、料理中に「ヘイ、Macaron、買い物リストにニンニクを追加して、5分のパスタタイマーをセットして」と言うかもしれません。それぞれのアクションを口頭で確認します(「ニンニクを追加しました。タイマーを5分にセットしました。」)ので、正しく理解されたことが分かります。これらの確認ループは、音声を使用する際の誤解を避けるために重要です。音声UXの研究から、明確な確認と音声でキャンセルや取り消しができる能力が、良いハンズフリー体験にとって重要であることを学びました(誰もが間違ったことをして、確認せずに突き進むAIを望んでいません)。

音声インタラクションは多くの分野でアクセシビリティを劇的に向上させます。これにより、移動が困難な人々が助かります(スワイプやタイピングが難しい場合でも不要です)、さらに、一部のユーザーにとって認知負荷を軽減します。リクエストを話すことは、複雑なGUIをナビゲートするよりも直感的かもしれません。より広範なトレンドに注目する価値があります。音声アシスタントはすでに数億人によって日常的に使用されており、従来のインターフェースに苦労していた人々に技術へのアクセスを開くのです。たとえば、視覚障害のある人は、Macaronの音声モードを使ってアプリを操作したり、メッセージを送ったり、情報を得たりすることができ、画面を見ることなく利用できます。教育の分野でも、音声技術は非常に価値があります。学齢期の子供の約20%が読み書きに問題を抱えており、音声対応の学習ツールは、彼らがコンテンツを聞いて吸収したり、書く代わりに話して反応したりすることを可能にします。Macaronの音声ファーストデザインはこれに合致しており、自然にインタラクションできるイコライザーです。運転中にコマンドを出す場合(ハンズフリー)や、ただ話すことを好む場合でも、AIは適応します。音声に違いがあったりアクセントがあったりしても、Macaronは常にあなたの声を学習しています。また、イリノイ大学の「音声アクセシビリティプロジェクト」のような進行中のプロジェクトは、非典型的な音声パターンのユーザーのために音声認識を向上させており、私たちもその進展を注視しています。

画像と文書の理解(アクション可能な情報の抽出;ユーザーの読解レベルに合わせた要約)

Macaronが得意とするもう一つのモードは、ビジョンです。単に画像やチャートを出力するだけでなく、あなたが与える視覚的な入力を理解します。人生には視覚情報があふれています:写真、スクリーンショット、スキャンしたPDF、スライド、製品のラベルなどです。Macaronはこれらを分析し、その中から意味やアクションを引き出す手助けをしてくれます。例えば、郵送された手紙や予約カードの写真を撮って、「これで何をすべきか教えて」とMacaronに尋ねることができます。OCRとビジョンAIを使用して、テキストを読み取り、解釈し、「6月5日午前10時に歯医者の予約があります。カレンダーに追加し、リマインダーを設定しました。」といった形で応答します。これは単なる説明を超えて、アクション可能な情報を抽出することにあります。フォームに対しても同様に(例:「ここにサインして金曜日までに人事に送ってください」)、またはメガネを見つけられないときにパッケージの成分を読み取るといった日常のタスクにも対応できます。

視覚障害者や低視力のユーザーは、見て世界を説明してくれるAIから恩恵を受けられます。Macaronは、Be My Eyesの「Be My AI」機能に似たコンピュータビジョンを活用し、画像の迅速で生き生きとした説明を提供し、それについての追跡質問にも答えます。このようにして、パーソナルAIは、サインの読み取り、物体の識別、チャートの簡単な英語での要約など、常に利用可能な視覚インタープリターとして役立ちます。

特定の読解レベルに要約する能力も革新的です。Macaronがディスレクシアのユーザー向けにテキストを簡素化する方法について議論しましたが、これは出会うすべての文書やウェブページにも拡張されます。学術論文や長いニュース記事をMacaronに入力し、「中学2年生の読解レベルで要約して」といえば、明確で簡潔な言葉で要約を生成します。背後では、LLMベースの高度なテキスト簡素化技術を使用して、意味を保持しながら複雑さを減らしています。これは、読解困難を抱えるユーザーだけでなく、非ネイティブ言語の話者(あるいは、正直に言えば、時間に追われている人)にも非常に役立ちます。ヨーロッパ全体で約20〜25%の人々が機能的非識字者であり、多くの人が非ネイティブ言語での識字能力が限られていることを考えると、このような機能の重要性は言うまでもありません。モダリティを適応させること(テキストを音声に変えたり、密集したテキストを簡素化されたテキスト+画像に変えたり)によって、Macaronはフォーマットによって情報から締め出されることがないようにします。これは、言語間、複雑さのレベル間、感覚モード間の「翻訳」を通じたアクセシビリティです。

デフォルトでのキャプションとトランスクリプト(音声/ボイス出力用)

マルチモーダルAIでは、音声出力は素晴らしいですが、誰もが音声を簡単に聞いたり処理したりできるわけではありません。だからこそ、Macaronが言ったり再生したりするすべてのことが、デフォルトでテキスト形式でも利用可能です。Macaronが音声で回答したり、要約をナレーションしたりするときは、チャットやアプリのログで同時にトランスクリプトを見ることができます。これは、聴覚障害者や難聴のユーザーにはもちろん有益ですが、多くのシナリオでも役立ちます。たとえば、静かな図書館にいて音を再生できない場合や、後で会話をざっと見返したい場合などです。特に、動画で字幕を使用する人の80%以上が聴覚障害者ではないという研究結果があります。彼らは便利さや騒がしい/静かな環境のために字幕を使用しています。Macaronでは、字幕は後付けではなく、組み込まれています。Macaronのインターフェースを通じてビデオやポッドキャストを視聴する場合(AIがキュレーションした学習プレイリストを想像してください)、自動生成された字幕と完全なトランスクリプトを得ることができ、追従したり、検索したりすることができます。最先端の音声認識モデルを活用して、これらのトランスクリプトを非常に正確にし、テキストは読みやすさを考慮してフォーマットされています(必要に応じてスピーカーラベルやタイムスタンプなど)。

トランスクリプトとキャプションは、多くのニューロダイバージェントユーザーの理解を向上させます。例えば、ADHDのある人は、AIの説明を聞きながら読みながら注意を集中させることができます。同様に、非ネイティブスピーカーは、聞いたことを確認するためにトランスクリプトをよく使用します。これらの多様な方法を提供することで、Macaronはあらゆるニーズに対応します。これは、ユニバーサルデザインの多様な表現の原則と一致しています。異なる好みに合わせて情報を異なる形で提示するというものです。そしてさらに一歩進んで、Macaronのトランスクリプトは検索可能でエクスポート可能です。これにより、先週AIが話した内容を確認したり、過去のセッションの要約を得たりすることができます(メタですね!)。要するに、音声が出力される場合、同等のテキストがすぐに提供されます。ユーザーがそれを探したり要求したりする必要はありません。アクセシビリティの世界では、これは基本をしっかりと行うことです。キャプションとトランスクリプトは、誰も話されたコンテンツから取り残されることがないようにします。セクション508のガイドラインによると、トランスクリプトは聴覚障害がある人だけのものではなく、言語学習者や騒がしい場所や静かな場所にいる誰にとっても役立ちます。Macaronはそれを完全に受け入れています。

Boxuはエモリー大学で定量経済学を専攻し、学士号を取得しました。Macaronに参加する前は、アメリカのプライベート・エクイティとベンチャー・キャピタル分野でキャリアを積んでいました。現在、彼はMacaron AIの参謀長兼マーケティング副社長として、財務、物流、運営を管理しつつ、マーケティングを監督しています。

応募する Macaron の最初の友達