رابط کاربری هوش مصنوعی (AI User Interface) به عنوان یکی از حوزههای کلیدی در طراحی و توسعه نرمافزار، به چگونگی تعامل انسان با سیستمهای هوش مصنوعی اشاره دارد. با پیشرفت تکنولوژی و افزایش کاربردهای هوش مصنوعی در زندگی روزمره، مثل دستیاران مجازی، سیستمهای توصیهگر و برنامههای تحلیل داده، ایجاد رابطهای کاربری کاربرپسند و کارآمد برای استفاده از این فناوریها به یک نیاز اساسی تبدیل شده است.
این رابطها باید به گونهای طراحی شوند که کاربران با سطوح مختلف تجربه فناوری، بتوانند به راحتی و بدون نیاز به دانش تخصصی از قابلیتهای هوش مصنوعی بهرهبرداری کنند. طراحی مطلوب رابط کاربری هوش مصنوعی نه تنها به بهبود تجربه کاربری کمک میکند، بلکه میتواند بر روی کارایی و اثربخشی سیستمهای هوش مصنوعی تأثیرگذار باشد.
اگر از افراد بپرسید آینده رابطهای کاربری در هوش مصنوعی چگونه خواهد بود، احتمالاً به فیلم Her اشاره میکنند. احتمالاً از دستیارهای مجازی صحبت میکنند که در آینده میتوانند همه کارهای روزمره شما را انجام دهند؛ از مرتب کردن ایمیلها گرفته تا رزرو بلیت برای یک جشنواره موسیقی . اما حقیقت چیز دیگری است.
فیلم “Her” درباره چگونگی تسلط تکنولوژی بر زندگی ما و تبدیل رابطه ما با آن به نوعی ارتباط یک طرفه است. اگر کسی تصور کند که چتباتها بهترین راه برای استفاده از کامپیوترها هستند، باید تجدید نظر کند. فرصت واقعی در رابطهای چتبات نیست، بلکه در کامپیوترهایی است که بر اساس رابطهای بصری که با آنها آشنا هستیم ساخته شدهاند؛ کامپیوترهایی که میتوانیم به شکلی طبیعی و روان با آنها ارتباط برقرار کنیم، خواه از طریق صدا یا لمس یا ترکیبی از هر دو.
رابطهای بصری: راه حلی برای تجربه بهتر کاربر
کامپیوترهای آینده نه تنها باید برای ما قابل استفاده باشند، بلکه باید به ما اجازه دهند تا آنها را به شکلی که میخواهیم تغییر دهیم. چتباتها به این دلیل ناکام میمانند که اصول ابتدایی موفقیت تلفنهای هوشمند را نادیده میگیرند: برای اینکه یک کامپیوتر مفید باشد، کاربران نیاز دارند که یک مدل ذهنی روشن از قابلیتها و محدودیتهای آن داشته باشند. موفقیت تلفنهای هوشمند بر پایه رابطهای کاربری گرافیکی (GUI) بنا شده است که نحوه استفاده از کامپیوترها را دگرگون کرده است. این رابطها با نشان دادن قابلیتهای کامپیوترها به صورت بصری و بدون ابهام، یادگیری و درک آنها را برای کاربران ساده و سریع کردند.
در حالی که امروزه رابطهای گرافیکی (GUI) را امری بدیهی میپنداریم، رابطهای چتبات شبیه جادو به نظر میرسند. شما میتوانید هر چیزی بگویید و پاسخ معقولی دریافت کنید. اما جادو میتواند ما را گمراه کند. این رابطها به شما این حس را میدهند که قادرند هر چیزی را بفهمند، اما در عمل نمیتوانند همه کارها را انجام دهند. همین تفاوت بین «هر چیزی» و «همه چیز» باعث میشود که بسیاری از ایدههای نادرست و محصولات هیجان زده در نهایت شکست بخورند.
مشکلات چتباتها به عنوان رابط اصلی
به عنوان مثال، شاید یک چتبات بتواند برای شما بلیطی برای کنسرت رزرو کند، اما آیا در صورت بروز مشکل میتواند بلیط شما را تغییر دهد؟ آیا میتواند از شما بپرسد که کدام پرواز بهترین گزینه برای بازگشت است؟
در واقع، ما قابلیتهای تعاملی رابطهای گرافیکی را به دلیل سادگی و کارآمدی شان به دست آوردهایم. اما وقتی از چتباتها استفاده میکنیم، هرگز به طور کامل نمیدانیم که تواناییهای آنها کجا شروع و کجا تمام میشود. با اینکه فهرست کارهایی که میتوانند انجام دهند روز به روز طولانیتر میشود، اما چطور میتوانیم همه این قابلیتها را به یاد داشته باشیم و بدانیم چه چیزهایی کار میکند و چه چیزهایی قرار است در آینده به آن اضافه شود؟
این مساله درباره مدلهای زبان بزرگ (LLMs) نیز صادق است. وقتی این مدلها به عنوان رابط اصلی استفاده میشوند، مشکلات ناشی از عدم تطابق مدل ذهنی کاربر و قابلیتهای واقعی سیستم دوباره ظاهر میشود. چتباتها و دستیارهای مجازی به دلیل رویکرد بازشان محدودیتهایی دارند که کاربران را وادار به آزمون و خطا برای کشف تواناییهایشان میکند. به جای این روش ناکارآمد، ما نیاز داریم تا راحتی و طبیعی بودن ورودیهای زبان را با ماشینهایی ترکیب کنیم که به وضوح قابلیتهایشان را نشان دهند.
ترکیب رابطهای بصری و چتباتها برای تجربه بهتر
تصور کنید، به جای اینکه مانند فردی ناآگاه با دستگاههای هوشمند خود صحبت کنید و منتظر واکنش آنها باشید، بتوانید از طریق عینک هوشمند (یا هر وسیله دیگری) به چیزی نگاه کنید و گزینههای تعاملی آن را در قالب یک منوی بصری ببینید؛ منویی که به شما نشان میدهد چه کنترلهایی در اختیار شماست. در این حالت، دیگر یک صدای مجازی به شما نخواهد گفت که چه کارهایی ممکن است، بلکه یک صفحه نمایش ساده و قابل فهم، مانند همان رابطهای قدیمی گرافیکی، این کار را انجام میدهد. شما میتوانید این رابط را با صدای خود یا دستانتان یا حتی ترکیبی از هر دو، کنترل کنید.
اما این هنوز نقطه اوج فرصتها نیست!
چرا نباید قادر باشیم تا نه تنها از فناوری استفاده کنیم، بلکه آن را بر اساس نیازهای خود بازسازی کنیم؟ آیندهای که ما میخواهیم باید شامل کامپیوترها و برنامههایی باشد که به ما اجازه میدهند آنها را به دلخواه خود تغییر دهیم.
مطالب مرتبط : تاثیر هوش مصنوعی بر نابرابری اقتصادی
پایان عصر مصرف منفعلانه: بازسازی فناوری بر اساس نیازهای ما
در دنیای امروزی، اگر از برنامه هتل خود راضی نیستید، نمیتوانید آن را تغییر دهید. اگر از نرمافزار بانکی خود ناراضی هستید و از وجود قابلیتهای غیر ضروری در آن خستهاید، چارهای جز قبول آن ندارید. ما توسط برنامهها و ابزارهایی محاصره شدهایم که فقط برای اهدافی که دیگران تعیین کردهاند، طراحی شدهاند. چرا نباید بتوانیم فناوری را به جای مصرف صرف، برای خودمان بازطراحی کنیم؟
این آیندهای است که بسیاری از پیشگامان فناوری در دهههای ۱۹۷۰ و ۱۹۹۰ تصور میکردند؛ آیندهای که در آن کاربران ابزارهای دیجیتالی نه تنها مصرف کنندگان بلکه سازندگان فناوری خواهند بود.
در دهه ۱۹۷۰، Steve Wozniak و the Homebrew چشم انداز دنیایی را داشتند که در آن هر کس میتواند کامپیوتر خود را تغییر داده و مطابق با نیازهایش طراحی کند. در دهه ۱۹۹۰، با ظهور وب جهانی (World Wide Web) این چشمانداز دوباره نزدیک شد. اما امروز، فاصله بین افرادی که از کامپیوترها استفاده میکنند و کسانی که آنها را تغییر میدهند، بیشتر از هر زمان دیگری است.
تصور کنید مجبور نبودید ویژگیهایی را که یک نابغه تکنولوژی در یک موج تبلیغاتی اعلام کرده بپذیرید. تصور کنید به جای اینکه اپلیکیشنی که شخص دیگری ساخته را دانلود کنید، بتوانید آن را با کمک یک کامپیوتر و از طریق بازسازی قابلیتهای هر اپلیکیشنی که تاکنون ساخته شده است، مطابق با خواسته خود بسازید. برنامه نویسان این ایده را “قابلیت ترکیب” مینامند. من فکر میکنم آینده از آنِ قابلیت ترکیب است: اما قابلیتی که هر کسی بتواند از آن استفاده کند.
این ایده در حال حاضر در حال جان گرفتن است. «Notion» ، که در ابتدا به عنوان نرم افزار سازمانی طراحی شده بود تا اسناد مختلف را در یک مکان جمع آوری و ایجاد کند، با نسل «Z» مورد توجه قرار گرفته است، زیرا برخلاف اکثر نرم افزارها که فقط هدفی محدود یا سفت و سخت دارند، به شما اجازه میدهد قالبهایی برای انجام انواع کارها بسازید و به اشتراک بگذارید. شما میتوانید امور مالی خود را مدیریت کنید یا یک طرح درسی برای مهد کودک در یک جا ایجاد کنید، با هر ابزاری که نیاز دارید.
حالا تصور کنید اگر بتوانید به تلفن تان بگویید که چه نوع قالبهای جدیدی میخواهید. یک مدل زبانی بزرگ میتواند تمام چیزهایی که نیاز دارید را جمع آوری کند و رابط کاربری مناسب برای آنها را طراحی کند. میخواهید یک اپلیکیشن آموزشی برای بافندگی داشته باشید؟ مشکلی نیست. یا یک راهنمای شخصی برای نیویورک؟ انجام شد. احتمالاً آن کامپیوتر از یک مدل زبانی بزرگ برای ترکیب این اپلیکیشنها استفاده خواهد کرد. عالی. این فقط به این معنی است که شما، به عنوان یک فرد عادی، میتوانید به راحتی به کد منبع نرم افزاری که ایجاد کردهاید نگاه کرده و آن را تغییر دهید.
بنابراین، توجه به اصول طراحی UX (تجربه کاربری) و UI (رابط کاربری) در این زمینه، امری ضروری است. این شناخت عمیق از نیازها و رفتارهای کاربران، به توسعه راهکارهای هوشمندتر و کاربرپسندتر منجر خواهد شد که میتواند به تسهیل و بهبود تعامل انسان با ماشین کمک کند.
کلید ساختن یک رابطه متفاوت با تکنولوژی، این است که هر کدام از ما قدرت داشته باشیم تا رابط کاربری آینده را به شکلی که دوست داریم، طراحی کنیم.