پایان اخبار جعلی و محتوای صوتی دستکاری‌شده با هوش مصنوعی

Written on 05/29/2024

News Editor

بخش تحقیقاتی Klick Health، روشی برای تجزیه و تحلیل صدا ابداع کرده است که می‌تواند تشخیص دهد صدا متعلق به یک فرد واقعی است یا یک هوش مصنوعی!

چشم‌ها شاید پنجره روح باشند، اما در Klick Labs، همه چیز در مورد صدا است. همزمان با افزایش روزافزون تعداد دیپ‌فیک‌ها، هوش مصنوعی اهمیت بیشتری پیدا می‌کند. دیپ‌فیک‌ها ویدیوها، فایل‌های صوتی یا عکس‌هایی هستند که با استفاده از هوش مصنوعی تولید می‌شوند. همچنین به قدری واقعی به نظر می‌رسند که تشخیص آنها از نمونه‌های واقعی دشوار است.

این پدیده افراد مشهوری از جمله تیلور سوییفت، خواننده پاپ، جو بایدن، رئیس جمهور آمریکا و حتی پاپ را نیز تحت تأثیر قرار داده است.

انتظار نمی‌رود این روند به زودی متوقف شود. یوروپل، آژانس اجرای قانون اتحادیه اروپا، اخیراً پیش‌بینی کرده است که تا سال ۲۰۲۶ ممکن است ۹۰ درصد از محتوای آنلاین به صورت مصنوعی تولید شود. همچنین سرویس اطلاعات امنیت کانادا این وضعیت را «تهدیدی واقعی برای آینده کانادا» خوانده است.

اما «یان فوسات»، معاون ارشد تحقیق و توسعه سلامت دیجیتال در Klick Labs، امیدوار است که شرکت او بتواند دنیای هوش مصنوعی را کمی امن‌تر کند. او افزود: «هر فناوری که تحت نظارت قرار نگیرد خطرناک است. این فناوری با سرعتی بیش از بسیاری از فناوری‌های دیگر در حال پیشرفت است.»

روش‌های مقابله با دیپ‌فیک‌ها

فوسات و تیمش در آزمایشگاهی پر از سیم و قطعات الکترونیکی، از فیلم‌های علمی تخیلی مانند «ترمیناتور» و «بلید رانر» برای ایده‌پردازی در مورد چگونگی مقابله با دیپ‌فیک‌ها الهام می‌گیرند. آنها به دنبال ایجاد دستگاهی هستند که بتواند انسان را از هوش مصنوعی تشخیص دهد، مشابه دستگاه Voight-Kampff در فیلم «بلید رانر».

محققان Klick Labs روشی برای تشخیص دیپ‌فیک‌ها با استفاده از “بیومارکرهای صوتی” ارائه کرده‌اند. این بیومارکرها، ویژگی‌هایی در صدا هستند که می‌توانند اطلاعاتی در مورد سلامت یا فیزیولوژی فرد گوینده ارائه دهند.

پایان اخبار جعلی و محتوای صوتی دستکاری‌شده با هوش مصنوعی

برای مثال، اگر کسی به تازگی از پله‌ها بالا دویده باشد، نفس‌نفس می‌زند که در صدایش قابل شنیدن است. صدا همچنین می‌تواند نشان دهد که فرد تازه از خواب بیدار شده یا احساس خستگی می‌کند.

محققان برای آموزش الگوریتم خود، از صداهای ۴۹ نفر با پیشینه و لهجه‌های مختلف استفاده کردند. آنها ۱۲ هزار بیومارکر صوتی را شناسایی کردند. اما در حال حاضر از 5 مورد برای تشخیص دیپ‌فیک‌ها استفاده می‌کنند. طول و تنوع گفتار، میزان مکث‌های کوتاه و بلند، و نسبت زمان صحبت به مکث.

این روش در حال حاضر ۸۰ درصد دقت دارد. اما ممکن است با پیشرفت تکنولوژی دیپ‌فیک، این دقت کاهش یابد.

تشخیص دیپ‌فیک‌ها با پیشرفت هوش مصنوعی دشوارتر می‌شود

فوسات، معاون ارشد Klick Labs، می‌گوید تشخیص اینکه آیا یک کلیپ دیپ‌فیک است یا خیر، به‌دلیل پیشرفت مداوم هوش مصنوعی که «هر روز به صدای انسان نزدیک‌تر می‌شود» دشوارتر می‌شود.

او به عنوان نمونه OpenAI، شرکتی که چت‌بات مبتنی بر هوش مصنوعی ChatGPT را ساخته، اشاره می‌کند که چند هفته پیش با یک صدای دیپ‌فیک جدید باورنکردنی وارد عرصه شد. این صدا حتی توانایی تقلید نفس کشیدن را دارد!

فوسات تأکید می‌کند که پیشرفت هوش مصنوعی، تحقیقات Klick Labs را بی‌ارزش نمی‌کند. به گفته او، هزاران بیومارکر دیگر مانند ضربان قلب وجود دارند که می‌توانند برای تشخیص دیپ‌فیک مورد آزمایش قرار گیرند.

پایان اخبار جعلی و محتوای صوتی دستکاری‌شده با هوش مصنوعی

علاوه بر این، ۱۶ مطالعه دیگر در حال انجام توسط Klick Labs بر روی بیومارکرهای صوتی و بیماری‌ها، می‌تواند به پیشرفت تحقیقات این شرکت در زمینه تشخیص دیپ‌فیک کمک کند. در یکی از این مطالعات، محققان با استفاده از بیومارکرهای صوتی موفق به تشخیص دیابت با دقت ۸۹ درصد برای زنان و ۸۶ درصد برای مردان شده‌اند.

هر پیشرفت در تحقیقات Klick Labs به معنای فرصت‌های بیشتر برای یادگیری در مورد بیومارکرها و به کارگیری آن‌ها در تشخیص بیماری‌ها و دیپ‌فیک‌هاست که مقابله با آن‌ها دشوار به نظر می‌رسد.

اگرچه هنوز چالش‌هایی در پیش است، تحقیقات Klick Labs نشان می‌دهد که ممکن است راه حلی برای مشکل اخبار جعلی و محتوای دستکاری شده با هوش مصنوعی (دیپ فیک) در دسترس باشد.