رابط کاربری هوش مصنوعی (AI User Interface) به عنوان یکی از حوزه‌های کلیدی در طراحی و توسعه نرم‌افزار، به چگونگی تعامل انسان با سیستم‌های هوش مصنوعی اشاره دارد. با پیشرفت تکنولوژی و افزایش کاربردهای هوش مصنوعی در زندگی روزمره، مثل دستیاران مجازی، سیستم‌های توصیه‌گر و برنامه‌های تحلیل داده، ایجاد رابط‌های کاربری کاربرپسند و کارآمد برای استفاده از این فناوری‌ها به یک نیاز اساسی تبدیل شده است.

این رابط‌ها باید به گونه‌ای طراحی شوند که کاربران با سطوح مختلف تجربه فناوری، بتوانند به راحتی و بدون نیاز به دانش تخصصی از قابلیت‌های هوش مصنوعی بهره‌برداری کنند. طراحی مطلوب رابط کاربری هوش مصنوعی نه تنها به بهبود تجربه کاربری کمک می‌کند، بلکه می‌تواند بر روی کارایی و اثربخشی سیستم‌های هوش مصنوعی تأثیرگذار باشد.

اگر از افراد بپرسید آینده رابط‌های کاربری در هوش مصنوعی چگونه خواهد بود، احتمالاً به فیلم Her اشاره می‌کنند. احتمالاً از دستیارهای مجازی صحبت می‌کنند که در آینده می‌توانند همه کارهای روزمره شما را انجام دهند؛ از مرتب کردن ایمیل‌ها گرفته تا رزرو بلیت برای یک جشنواره موسیقی . اما حقیقت چیز دیگری است.

فیلم “Her” درباره چگونگی تسلط تکنولوژی بر زندگی ما و تبدیل رابطه ما با آن به نوعی ارتباط یک ‌طرفه است. اگر کسی تصور کند که چت‌بات‌ها بهترین راه برای استفاده از کامپیوترها هستند، باید تجدید نظر کند. فرصت واقعی در رابط‌های چت‌بات نیست، بلکه در کامپیوترهایی است که بر اساس رابط‌های بصری که با آنها آشنا هستیم ساخته شده‌اند؛ کامپیوترهایی که می‌توانیم به شکلی طبیعی و روان با آنها ارتباط برقرار کنیم، خواه از طریق صدا یا لمس یا ترکیبی از هر دو.

رابط‌های بصری: راه‌ حلی برای تجربه بهتر کاربر

کامپیوترهای آینده نه تنها باید برای ما قابل استفاده باشند، بلکه باید به ما اجازه دهند تا آن‌ها را به شکلی که می‌خواهیم تغییر دهیم. چت‌بات‌ها به این دلیل ناکام می‌مانند که اصول ابتدایی موفقیت تلفن‌های هوشمند را نادیده می‌گیرند: برای اینکه یک کامپیوتر مفید باشد، کاربران نیاز دارند که یک مدل ذهنی روشن از قابلیت‌ها و محدودیت‌های آن داشته باشند. موفقیت تلفن‌های هوشمند بر پایه رابط‌های کاربری گرافیکی (GUI) بنا شده است که نحوه استفاده از کامپیوترها را دگرگون کرده است. این رابط‌ها با نشان دادن قابلیت‌های کامپیوترها به صورت بصری و بدون ابهام، یادگیری و درک آن‌ها را برای کاربران ساده و سریع کردند.

در حالی که امروزه رابط‌های گرافیکی (GUI) را امری بدیهی می‌پنداریم، رابط‌های چت‌بات شبیه جادو به نظر می‌رسند. شما می‌توانید هر چیزی بگویید و پاسخ معقولی دریافت کنید. اما جادو می‌تواند ما را گمراه کند. این رابط‌ها به شما این حس را می‌دهند که قادرند هر چیزی را بفهمند، اما در عمل نمی‌توانند همه کارها را انجام دهند. همین تفاوت بین «هر چیزی» و «همه چیز» باعث می‌شود که بسیاری از ایده‌های نادرست و محصولات هیجان‌ زده در نهایت شکست بخورند.

مشکلات چت‌بات‌ها به عنوان رابط اصلی

به عنوان مثال، شاید یک چت‌بات بتواند برای شما بلیطی برای کنسرت رزرو کند، اما آیا در صورت بروز مشکل می‌تواند بلیط شما را تغییر دهد؟ آیا می‌تواند از شما بپرسد که کدام پرواز بهترین گزینه برای بازگشت است؟

در واقع، ما قابلیت‌های تعاملی رابط‌های گرافیکی را به دلیل سادگی و کارآمدی ‌شان به دست آورده‌ایم. اما وقتی از چت‌بات‌ها استفاده می‌کنیم، هرگز به طور کامل نمی‌دانیم که توانایی‌های آن‌ها کجا شروع و کجا تمام می‌شود. با اینکه فهرست کارهایی که می‌توانند انجام دهند روز به روز طولانی‌تر می‌شود، اما چطور می‌توانیم همه این قابلیت‌ها را به یاد داشته باشیم و بدانیم چه چیزهایی کار می‌کند و چه چیزهایی قرار است در آینده به آن اضافه شود؟

این مساله درباره مدل‌های زبان بزرگ (LLMs) نیز صادق است. وقتی این مدل‌ها به عنوان رابط اصلی استفاده می‌شوند، مشکلات ناشی از عدم تطابق مدل ذهنی کاربر و قابلیت‌های واقعی سیستم دوباره ظاهر می‌شود. چت‌بات‌ها و دستیارهای مجازی به دلیل رویکرد بازشان محدودیت‌هایی دارند که کاربران را وادار به آزمون و خطا برای کشف توانایی‌هایشان می‌کند. به جای این روش ناکارآمد، ما نیاز داریم تا راحتی و طبیعی بودن ورودی‌های زبان را با ماشین‌هایی ترکیب کنیم که به وضوح قابلیت‌هایشان را نشان دهند.

ترکیب رابط‌های بصری و چت‌بات‌ها برای تجربه بهتر

تصور کنید، به جای اینکه مانند فردی ناآگاه با دستگاه‌های هوشمند خود صحبت کنید و منتظر واکنش آن‌ها باشید، بتوانید از طریق عینک هوشمند (یا هر وسیله دیگری) به چیزی نگاه کنید و گزینه‌های تعاملی آن را در قالب یک منوی بصری ببینید؛ منویی که به شما نشان می‌دهد چه کنترل‌هایی در اختیار شماست. در این حالت، دیگر یک صدای مجازی به شما نخواهد گفت که چه کارهایی ممکن است، بلکه یک صفحه نمایش ساده و قابل فهم، مانند همان رابط‌های قدیمی گرافیکی، این کار را انجام می‌دهد. شما می‌توانید این رابط را با صدای خود یا دستانتان یا حتی ترکیبی از هر دو، کنترل کنید.

 اما این هنوز نقطه اوج فرصت‌ها نیست!

چرا نباید قادر باشیم تا نه‌ تنها از فناوری استفاده کنیم، بلکه آن را بر اساس نیازهای خود بازسازی کنیم؟ آینده‌ای که ما می‌خواهیم باید شامل کامپیوترها و برنامه‌هایی باشد که به ما اجازه می‌دهند آن‌ها را به ‌دلخواه خود تغییر دهیم.

پایان عصر مصرف منفعلانه: بازسازی فناوری بر اساس نیازهای ما

در دنیای امروزی، اگر از برنامه هتل خود راضی نیستید، نمی‌توانید آن را تغییر دهید. اگر از نرم‌افزار بانکی خود ناراضی هستید و از وجود قابلیت‌های غیر ضروری در آن خسته‌اید، چاره‌ای جز قبول آن ندارید. ما توسط برنامه‌ها و ابزارهایی محاصره شده‌ایم که فقط برای اهدافی که دیگران تعیین کرده‌اند، طراحی شده‌اند. چرا نباید بتوانیم فناوری را به جای مصرف صرف، برای خودمان بازطراحی کنیم؟

این آینده‌ای است که بسیاری از پیشگامان فناوری در دهه‌های ۱۹۷۰ و ۱۹۹۰ تصور می‌کردند؛ آینده‌ای که در آن کاربران ابزارهای دیجیتالی نه ‌تنها مصرف‌ کنندگان بلکه سازندگان فناوری خواهند بود.

در دهه ۱۹۷۰، Steve Wozniak  و  the Homebrew چشم‌ انداز دنیایی را داشتند که در آن هر کس می‌تواند کامپیوتر خود را تغییر داده و مطابق با نیازهایش طراحی کند. در دهه ۱۹۹۰، با ظهور وب جهانی (World Wide Web) این چشم‌انداز دوباره نزدیک شد. اما امروز، فاصله بین افرادی که از کامپیوترها استفاده می‌کنند و کسانی که آن‌ها را تغییر می‌دهند، بیشتر از هر زمان دیگری است.

 تصور کنید مجبور نبودید ویژگی‌هایی را که یک نابغه تکنولوژی در یک موج تبلیغاتی اعلام کرده بپذیرید. تصور کنید به جای اینکه اپلیکیشنی که شخص دیگری ساخته را دانلود کنید، بتوانید آن را با کمک یک کامپیوتر و از طریق بازسازی قابلیت‌های هر اپلیکیشنی که تاکنون ساخته شده است، مطابق با خواسته خود بسازید. برنامه‌ نویسان این ایده را “قابلیت ترکیب” می‌نامند. من فکر می‌کنم آینده از آنِ قابلیت ترکیب است: اما قابلیتی که هر کسی بتواند از آن استفاده کند.

 این ایده در حال حاضر در حال جان گرفتن است. «Notion» ، که در ابتدا به عنوان نرم‌ افزار سازمانی طراحی شده بود تا اسناد مختلف را در یک مکان جمع‌ آوری و ایجاد کند، با نسل «Z» مورد توجه قرار گرفته است، زیرا برخلاف اکثر نرم ‌افزارها که فقط هدفی محدود یا سفت و سخت دارند، به شما اجازه می‌دهد قالب‌هایی برای انجام انواع کارها بسازید و به اشتراک بگذارید. شما می‌توانید امور مالی خود را مدیریت کنید یا یک طرح درسی برای مهد کودک در یک جا ایجاد کنید، با هر ابزاری که نیاز دارید.

 حالا تصور کنید اگر بتوانید به تلفن ‌تان بگویید که چه نوع قالب‌های جدیدی می‌خواهید. یک مدل زبانی بزرگ می‌تواند تمام چیزهایی که نیاز دارید را جمع ‌آوری کند و رابط کاربری مناسب برای آن‌ها را طراحی کند. می‌خواهید یک اپلیکیشن آموزشی برای بافندگی داشته باشید؟ مشکلی نیست. یا یک راهنمای شخصی برای نیویورک؟ انجام شد. احتمالاً آن کامپیوتر از یک مدل زبانی بزرگ برای ترکیب این اپلیکیشن‌ها استفاده خواهد کرد. عالی. این فقط به این معنی است که شما، به عنوان یک فرد عادی، می‌توانید به راحتی به کد منبع نرم‌ افزاری که ایجاد کرده‌اید نگاه کرده و آن را تغییر دهید.

بنابراین، توجه به اصول طراحی UX (تجربه کاربری) و UI (رابط کاربری) در این زمینه، امری ضروری است. این شناخت عمیق از نیازها و رفتارهای کاربران، به توسعه راهکارهای هوشمندتر و کاربرپسندتر منجر خواهد شد که می‌تواند به تسهیل و بهبود تعامل انسان با ماشین کمک کند.

کلید ساختن یک رابطه متفاوت با تکنولوژی، این است که هر کدام از ما قدرت داشته باشیم تا رابط کاربری آینده را به شکلی که دوست داریم، طراحی کنیم.

۰/۵ (۰ نظر)