صحت اطلاعات در استفاده از هوش مصنوعی بسیار حیاتی است زیرا اطلاعات نادرست یا ناقص می تواند منجر به تصمیمات نادرست و خطرناک شود. در حوزه هوش مصنوعی، داده های صحیح و دقیق از اهمیت بسیاری برخوردار هستند زیرا الگوریتم ها و مدل های هوش مصنوعی بر اساس این داده ها عمل می کنند.
استفاده از داده های نادرست می تواند منجر به تبعیض، ناعدالتی و حتی خطر جانی شود. به عنوان مثال، اگر یک سیستم هوش مصنوعی بر اساس داده های نادرست آموزش دیده باشد، ممکن است تصمیمات نادرستی در مورد تشخیص بیماری ها، پیش بینی جرم و جنایت و یا حتی تصمیمات مهم دیگر بگیرد.
بنابراین، اطمینان از صحت و دقت داده ها و اطلاعات استفاده شده در مدل های هوش مصنوعی بسیار حیاتی است. برای این منظور، لازم است که داده ها از منابع معتبر و قابل اعتماد جمع آوری شوند و همچنین الگوریتم ها و مدل های هوش مصنوعی به صورت دقیق آموزش داده شوند. از این رو، توجه به صحت اطلاعات یکی از اصول اساسی در طراحی و استفاده از سیستم های هوش مصنوعی است.
با افزایش استفاده از هوش مصنوعی و امکان تغییر دادن محتوا در اینترنت، نیاز به اطمینان از صحت دادهها و برندها از همیشه بیشتر شده است. Scott Dykstra مشاور فناوری و بنیان گذار استارتاپ Space and Time، در پادکست TechCrunch’s Chain Reaction podcast تاکید می کند که باید از اطلاعات و برندها اطمینان حاصل شود .
برای مثال، در زمان فروپاشی صرافی رمزارز FTX، این سازمان دادههای داخلی خود را تغییر داده و سرمایهگذاران را گمراه کرده بود. این کار مشابه درخواستی به پایگاه داده برای دریافت سوابق مالی است در صورتی که اطلاعات در داخل پایگاه داده تغییر داده شده است.در واقع FTX یک سازمان بود که مردم به عنوان یک برند به آن اعتماد داشتند. این مشکل به فروپاشی FTX محدود نمی شود و در موسسات مالی، انگیزهای برای تغییر سوابق وجود دارد. بنابراین این مشکل به طور مداوم مشاهده می شود .
مطالب مرتبط : شرکت ها با جعل هویت توسط هوش مصنوعی مولد مبارزه می کنند
اما چه راه حلی برای این مشکل وجود دارد؟
از نظرDykstra راه حل در تأیید داده ها و استفاده از روش zero-knowledge proofs(zk proofs ) است. در این روش از عملیات های رمزنگاری برای اثبات اعتبار اطلاعات استفاده می شود، بدون اینکه داده ی اصلی افشا شود.
به عبارت دیگر، این الگوریتم به اثبات کننده اجازه می دهد که بدون انتقال هر گونه اطلاعات اضافی، صحت ادعای خود را ثابت کند.
هر زمان که انگیزهای برای تغییر دادهها، قیمتها، دفاتر و مالیات وجود داشته باشد، الگوریتم ZK proofs می تواند برای تأیید و بازیابی دادهها مورد استفاده قرار گیرد.
در سطح بالا، الگوریتم ZK proofs برای تأیید درستی یک موضوع بدون افشای هیچ اطلاعاتی به جز اینکه آیا درست است یا نه، کار می کنند. به عنوان مثال، اگر بخواهم بفهمم امتیاز اعتباری کسی بیش از ۷۰۰ است، اگر چنین چیزی وجود داشته باشد، یک اثبات کننده ZK می تواند به تأیید کننده اطلاع دهد که این موضوع درست است، بدون افشای دقیق عدد مورد نظر.
هدف استارتاپ Space and Time این است که به عنوان لایه محاسبات قابل تأیید برای web3 با ایندکس گذاری داده ها به صورت off-chain و on-chain عمل کند.
در حال حاضر تیم هایی بر روی ساخت الگوریتم های ZK proofs برای یادگیری ماشین یا مدلهای زبان بزرگ کار می کنند، اما ایجاد این الگوریتم ها ممکن است سالها طول بکشد. این به این معناست که اپراتور مدل می تواند سیستم یا LLM را دستکاری کند و تائید صحت اطلاعات را با مشکل مواجه کند.
دادههای هوش مصنوعی به راحتی قابل تأیید نیستند و این نگرانی وجود دارد که به طور موثر قادر به تأیید اجرای صحیح یک مدل زبان بزرگ (LLM) نباشیم.
از نظر کارشناسان Space and Time نیاز به یک “پایگاه داده غیر متمرکز و در سطح جهانی و همیشه در دسترس” وجود دارد که از طریق زنجیره های بلاکچین ایجاد شود. همه باید به آن دسترسی داشته باشند و نباید انحصاری باشد و راهی برای اجتناب از این موضوع وجود ندارد.
به عنوان مثال، در یک سناریوی فرضی که توسطDykstra ارائه شده است، یک OpenAI نمی تواند مالک پایگاه دادهای از یک مجله باشد که خبرنگاران برای آن محتوا تولید می کنند. به جای آن، پایگاه داده باید توسط جامعه مالکیت داشته باشد و توسط جامعه به نحوی که به راحتی در دسترس و غیرقابل سانسور باشد، اداره شود.