شما قبلا این خبر را لایک کرده‌اید .

کپی شد

کد خبر: ۶۶۵۵۶۲

۱۴:۳۶ - ۲۵ شهریور ۱۴۰۲

ایراد بزرگی که ژاپنی‌ها در هوش مصنوعی مشهور پیدا کردند

دولت ژاپن و شرکت‌های بزرگ فناوری مانند NEC، فوجیتسو و سافت‌بانک صد‌ها میلیون دلار برای ایجاد سیستم‌های هوش مصنوعی صرف می‌کنند که بر اساس همان فناوری زیربنایی معروف به مدل‌های زبانی بزرگ کار می‌کنند، اما به جای ترجمه نسخه انگلیسی از زبان ژاپنی استفاده می‌کنند.

برخی از محققان ژاپنی احساس می‌کنند که سیستم‌های هوش مصنوعی آموزش دیده بر اساس زبان‌های خارجی غیر ژاپنی نمی‌توانند پیچیدگی‌های زبان و فرهنگ ژاپنی را درک کنند، بنابراین اکنون می‌خواهند نسخه‌ای از چت جی‌پی‌تی مخصوص ژاپن را توسعه دهند.

به گزارش ایسنا، ژاپن در حال ساخت نسخه‌های خود از چت جی‌پی‌تی (ChatGPT) است. این ربات هوش مصنوعی که توسط شرکت آمریکایی OpenAI ساخته شده است پس از رونمایی در کمتر از یک سال قبل، به طور جهانی مورد توجه قرار گرفت.

کیسوکه ساکاگوچی (Keisuke Sakaguchi)، محقق دانشگاه توهوکو در ژاپن که متخصص پردازش زبان طبیعی است، می‌گوید: مدل‌های زبانی بزرگ عمومی فعلی، مانند جی‌پی‌تی، در زبان انگلیسی برتری دارند، اما اغلب در زبان ژاپنی به دلیل تفاوت در سیستم الفبا، داده‌های محدود و سایر عوامل دچار کاستی هستند.

تعصب زبان انگلیسی

مدل‌های زبانی بزرگ به طور معمول از حجم عظیمی از داده‌ها و منابع در دسترس عموم برای یادگیری الگو‌های گفتار و نثر طبیعی استفاده می‌کنند. آن‌ها آموزش می‌بینند که کلمه بعدی را بر اساس کلمات قبلی در یک متن پیش‌بینی کنند. اکثریت قریب به اتفاق متنی که مدل قبلی چت جی‌پی‌تی یعنی جی‌پی‌تی -۳ (GPT-۳)، براساس آن آموزش داده شده بود، به زبان انگلیسی بود.

توانایی قابل توجه چت جی‌پی‌تی در برقراری مکالمات مشابه انسان، هم محققان را خوشحال و هم نگران کرده است. برخی آن را یک ابزار بالقوه برای صرفه جویی در نیروی کار می‌دانند در حالی که دیگران نگران هستند که از آن برای ساخت مقالات یا داده‌های علمی استفاده شود.

در ژاپن، این نگرانی وجود دارد که سیستم‌های هوش مصنوعی آموزش‌دیده بر روی مجموعه‌های داده به زبان‌های دیگر نتوانند پیچیدگی‌های زبان و فرهنگ ژاپن را درک کنند. ساختار جملات در زبان ژاپنی کاملا متفاوت از انگلیسی است؛ بنابراین چت جی‌پی‌تی باید یک درخواست ژاپنی را به انگلیسی ترجمه کند، پاسخ را بیابد و سپس پاسخ را به ژاپنی ترجمه کند.

در حالی که زبان انگلیسی تنها ۲۶ حرف دارد، زبان ژاپنی نوشتاری متشکل از دو مجموعه ۴۸ حرفی اصلی، به علاوه ۲۱۳۶ نویسه چینی یا کانجی است که به طور منظم استفاده می‌شود. اکثر کانجی‌ها دو یا چند تلفظ دارند و ۵۰ هزار کانجی دیگر وجود دارد که به ندرت استفاده می‌شود. با توجه به این پیچیدگی، جای تعجب نیست که چت جی‌پی‌تی نتواند با این زبان دست و پنجه نرم کند.

ساکاگوچی می‌گوید در زبان ژاپنی، چت جی‌پی‌تی گاهی اوقات نویسه‌های بسیار کمیابی تولید می‌کند که اکثر مردم هرگز آن‌ها را ندیده‌اند و در نتیجه کلمات ناشناخته عجیب و غریب به‌وجود می‌آید.

هنجار‌های فرهنگی

برای اینکه یک مدل زبانی بزرگ مفید و حتی از نظر تجاری قابل دوام باشد، باید فرهنگ و همچنین زبان را به طور دقیق منعکس کند. برای مثال، اگر از چت جی‌پی‌تی خواسته شود که یک ایمیل درخواست شغل به زبان ژاپنی بنویسد، ممکن است عبارات استاندارد ادبی را حذف کند و نتیجه آن مانند ترجمه‌ای واضح از انگلیسی به نظر برسد.

برای سنجش میزان حساسیت مدل‌های زبانی بزرگ نسبت به فرهنگ ژاپنی، گروهی از محققان راکودا (Rakuda) را راه اندازی کردند. راکودا رتبه بندی است که نشان می‌دهد مدل‌های زبانی بزرگ تا چه اندازه می‌توانند به سوالات باز در مورد موضوعات ژاپنی پاسخ دهند.

سم پاساگلیا (Sam Passaglia)، بنیانگذار راکودا و همکارانش، از چت جی‌پی‌تی خواستند که روان بودن و تناسب فرهنگی پاسخ‌ها را با درخواست‌های استاندارد مقایسه کند.

پاساگلیا، فیزیکدان دانشگاه توکیو که مدل‌های زبان ژاپنی را مطالعه می‌کند، می‌گوید: مسلما مدل‌های زبانی بزرگ ژاپنی بهبود زیادی می‌یابند، اما در حال حاضر آن‌ها بسیار عقب‌تر از جی‌پی‌تی -۴ هستند. او می‌گوید، اصولا دلیلی وجود ندارد که یک مدل زبانی بزرگ ژاپنی نتواند در آینده برابر با جی‌پی‌تی-۴ باشد یا از آن پیشی بگیرد. این از نظر فنی قابل حل است، اما مشکل منابع وجود دارد.

یکی از تلاش‌ها برای ایجاد یک مدل زبانی بزرگ ژاپنی استفاده از ابررایانه ژاپنی فوگاکو (Fugaku) است. فوگاکو که یکی از سریع‌ترین‌های جهان است عمدتا مدل زبانی را بر اساس ورودی ژاپنی آموزش می‌دهد.

با حمایت موسسه فناوری توکیو، دانشگاه توهوکو، فوجیتسو و گروه مراکز تحقیقاتی ریکن (RIKEN) با بودجه دولتی، انتظار می‌رود مدل زبانی حاصل در سال آینده منتشر شود.

این مدل زبانی بزرگ برخلاف جی‌پی‌تی-۴ و سایر مدل‌های اختصاصی، به سایر مدل‌های زبانی منبع باز ملحق می‌شود تا کد خود را در دسترس همه کاربران قرار دهد. به گفته ساکاگوچی، که در این پروژه مشارکت دارد، محققان امیدوارند دستکم ۳۰ میلیارد پارامتر به آن بدهد که بر خروجی آن تأثیر می‌گذارد و می‌توانند به عنوان معیاری برای اندازه آن عمل کند.

با این حال، مدل زبانی فوگاکو ممکن است توسط یک مدل حتی بزرگتر جانشین شود.

وزارت آموزش، فرهنگ، ورزش، علم و فناوری ژاپن بودجه ایجاد یک برنامه هوش مصنوعی ژاپنی را که مطابق با نیاز‌های علمی است، تامین می‌کند که با یادگیری از تحقیقات منتشر شده، فرضیه‌های علمی ایجاد کند و به شناسایی اهداف برای تحقیقات سرعت بخشد. این مدل می‌تواند با ۱۰۰ میلیارد پارامتر شروع به کار کند که کمی بیش از نیمی از اندازه جی‌پی‌تی-۳ است و به مرور زمان گسترش می‌یابد.

ماکوتو تایجی (Makoto Taiji)، معاون مرکز تحقیقات دینامیک بیوسیستم ریکن، در مورد این پروژه می‌گوید: امیدواریم چرخه تحقیقات علمی را به طور چشمگیری سرعت بخشیم و فضای جستجو را گسترش دهیم. توسعه مدل زبانی بزرگ دستکم ۳۰ میلیارد ین (۲۰۴ میلیون دلار آمریکا) هزینه خواهد داشت و انتظار می‌رود در سال ۲۰۳۱ به صورت عمومی منتشر شود.

گسترش قابلیت‌ها

دیگر شرکت‌های ژاپنی در حال تجاری سازی یا برنامه‌ریزی برای تجاری‌سازی فناوری‌های مدل‌های زبانی بزرگ خود هستند.

سازنده ابر رایانه NEC در ماه مه استفاده از هوش مصنوعی مولد خود را بر اساس زبان ژاپنی آغاز کرد و ادعا می‌کند که این مدل زبانی زمان مورد نیاز برای ایجاد گزارش‌های داخلی را ۵۰ درصد و کد منبع نرم افزار داخلی را ۸۰ درصد کاهش می‌دهد. در ماه ژوئیه، این شرکت شروع به ارائه خدمات هوش مصنوعی با قابلیت شخصی‌سازی به مشتریان کرد.

ماسافومی اویامادا (Masafumi Oyamada)، محقق اصلی در آزمایشگاه‌های علوم داده NEC، می‌گوید که می‌توان از آن در طیف وسیعی از صنایع مانند صنایع مالی، حمل‌ونقل و تدارکات، توزیع و ساخت استفاده کرد. او اضافه می‌کند که محققان می‌توانند آن را برای نوشتن کد، کمک به نوشتن و ویرایش مقالات و بررسی مقالات منتشر شده موجود استفاده کنند.

در همین حال، شرکت مخابراتی ژاپنی سافت‌بانک (SoftBank)، حدود ۲۰ میلیارد ین روی هوش مصنوعی مولد آموزش داده شده بر روی متون ژاپنی سرمایه گذاری کرده و قصد دارد سال آینده مدل زبانی بزرگ خود را راه‌اندازی کند. سافت بانک که ۴۰ میلیون مشتری دارد و با مایکروسافت سرمایه گذار شرکت OpenAI نیز شراکت دارد، می‌گوید که قصد دارد به شرکت‌ها کمک کند تا کسب و کار خود را دیجیتالی کنند و بهره‌وری خود را افزایش دهند. سافت بانک انتظار دارد که مدل زبانی بزرگ آن‌ها توسط دانشگاه‌ها، موسسات تحقیقاتی و سایر سازمان‌ها مورد استفاده قرار گیرد.

در همین حال، محققان ژاپنی امیدوارند که یک چت‌بات هوش مصنوعی دقیق، موثر و ساخت ژاپن بتواند به سرعت بخشیدن به علم و پر کردن شکاف بین ژاپن و سایر نقاط جهان کمک کند.

بیشتر بدانید:

ژاپن هوش مصنوعی

زیر پوست اعتراضات دی ۱۴۰۴

بازدید از صفحه اول ارسال به دوستان

شما قبلا این خبر را لایک کرده‌اید .

زیر پوست اعتراضات دی ۱۴۰۴

ارسال نظرات

مجله خواندنی

خط داغ

پزشکیان: مقصر شرایط موجود من هستم
مقصر شرایط موجود مردم، کارمندان یا دانشجویان نیستند؛ مقصر من هستم، ما هستیم. باید عملکردمان را اصلاح کنیم.
گزارش فارس از ناآرامی‌های امروز ملک‌شاهی
بررسی‌های اولیه از زخمی شدن چند نیروی پلیس و شهادت یک نفر در این حوادث حکایت دارد. مشاهدات خبرنگار فارس نشان می‌دهد که…
خرید غیرحضوری کالابرگ؛ راهنمای خرید و معرفی فروشگاه‌های طرح
اسنپ‌مارکت، دیجی‌کالا و فروشگاه‌های زنجیره‌ای افق کوروش مهم‌ترین گزینه‌ها برای خرید اینترنتی با کالابرگ الکترونیکی هستند
جلسه صمیمانه رامین و ساپینتو؛ آشتی یا توافق برای جدایی؟!
تصویر جالبی از گفتگوی دو نفره میان رامین رضاییان و ریکاردو ساپینتو در حاشیه تمرین امروز استقلال منتشر شده است.
دو انتخاب برای مردم در طرح جدید کالابرگ
وزیر تعاون می‌گوید مردم می‌توانند به انتخاب خود، اقلام روغن، مرغ، برنج و پنیر را به‌صورت سهمیه‌ای و با قیمت‌های قبل…
جزئیات اعتراضات بازار تهران به روایت ایسنا
برخلاف روز گذشته که بازار تهران جو آرامی داشت و اغلب مغازه‌ها باز بودند، امروز بازارهای مختلف شاهد اعتراض‌های صنفی…
کشف ماری با چشمان عجیب در جنگل‌های گینه نو
دانشمندان در جزیره میسیما گونه‌ای جدید از مار درختی را کشف کرده‌اند که چشم‌های بزرگ و پوست کاملاً سیاه دارد. این مار…
روایت خبرگزاری فارس از تجمع در محدوده بازار تهران
طبق شواهد به‌دست‌آمده، حدود ۱۵۰ نفر در خیابان ناصرخسروی بازار تهران شعار دادند که با ورود نیروهای پلیس این تجمع متفرق…
قاتل امیرمحمد بخشیده شد
پدر امیرمحمد خالقی، دانشجوی نخبه دانشگاه تهران صبح امروز با حضور در دادسرای جنایی تهران قاتل پسرش را بخشید. جلسه صلح و…
نمایندگان مجلس خطاب به مردم: ما هم «معترض» هستیم
نمایندگان مجلس ضمن ابراز همراهی با مردم تأکید کردند که مجلس نیز نسبت به گرانی های افسارگسیخته معترض است.
استعلام کالابرگ با کد ملی و گوشی به سه روش ساده
۸۰ میلیون ایرانی می‌تواند از شیوه و مبلغ جدید کالابرگ استفاده کند
ثروتمندترین‌های جهان در سال ۲۰۲۶ از لنز مجله فوربز
نشریه فوربز در تازه‌ترین گزارش خود نام ۱۰ نفر از ثروتمندترین‌های جهان را منتشر کرد.
جزئیات تازه رئیس پنتاگون از عملیاتِ بازداشت مادورو/ تا سه دقیقه پیش از ورود نیروهای آمریکایی هیچ اطلاعی از آن‌ها نداشت
وزیر جنگ آمریکا جزئیات جدیدی از عملیات مخفی و غیرقانونی بازداشت نیکلاس مادورو رئیس جمهور قانونی ونزوئلا منتشر کرد.
ماجرای شنیده‌شدن صدای انفجار در خرم‌آباد چه بود؟
روابط‌عمومی و رسانه قرارگاه عملیاتی لشکر ۸۴ پیاده لرستان از امحای مهمات تاریخ‌گذشته در خرم‌آباد خبر داد.
هشدار دبیرخانه شورای دفاع: ایران خود را محدود به واکنش پس از اقدام نمی‌داند
در بیانیه دبیرخانه شورای دفاع آمده است: تشدید ادبیات تهدید و مداخله که فراتر از یک موضع‌گیری لفظی است، می‌تواند…
مرخصی ویژه برای زنان؛ امتیاز حمایتی یا مسیر حذف از بازار کار؟
طرح‌هایی مانند مرخصی ویژه زنان و دورکاری تشویقی بانوان در حال حاضر به‌عنوان راه‌حل افزایش رفاه زنان شاغل در مجلس مطرح…
قیمت طلا، سکه، دلار و یورو امروز سه‌شنبه ۱۶ دی ۱۴۰۴/ عبور طلا از مرز ۱۶ میلیون
هر گرم طلا ۱۸ عیار امروز ۳۳۲ هزار تومان گران شد
اظهارات جالب سعید پیردوست درباره علی دایی
سعید پیردوست بازیگر با سابقه کشورمان که صبح سه‌شنبه ۱۶ دی چشم از جهان فرو بست، سال‌ها قبل در گفتگویی اختصاصی با…
قیمت جدید روغن چه تغییری کرد؟
قیمت روغن تقریبا ۳ برابر شد. روغن مایع معمولی بسته به وزن بطری از ۱۸۲هزار تومان تا یک میلیون و ۲۳۸ هزار تومان به فروش م…
واکنش زیدآبادی به ادعای نخست‌وزیر سابق اسرائیل: بازی‌ات گرفته؟/ بدبختانه عده‌ای از ایرانیان هم سر کار می‌روند!
نفتالی بنت با استفاده از کلمات و شکل‌های نمادین در فضای مجازی و ادعای اطلاع از اتفاقی محیرالعقول و قریب‌الوقوع…
رئیس جمهور کلمبیا ماستش را کیسه کرد: ترامپ باور کن نه اهل مواد مخدرم و نه میلیاردر!
رئیس جمهور کلمبیا در واکنش به تهدید ترامپ گفت که او آدم سالمی است و اهل مواد مخدر و اقدامات غیرقانونی نیست.
دستور وزیر کشور درباره حوادث ایلام/ هیئت ویژه‌ اعزام شد
وزیر کشور در پی دستور رئیس‌جمهور درخصوص بررسی حوادث ایلام، بلافاصله هیأت ویژه‌ای را مأمور پیگیری این حوادث کرد.
پزشکیان: ما و مجلس مقصر این وضعیت هستیم/ به فکر رأی دوره بعد نیستم
پزشکیان با بیان اینکه «رسانه‌ها ما را زیر ذره‌بین بگذارند؛ اگر به دار و دسته خود رانتی دادیم آبروی‌مان را ببرید»، گفت:…
ارزیابی محرمانه سیا از آینده ونزوئلا/ چرا نزدیکان مادورو گزینه مطلوب واشینگتن‌اند؟
نشریه وال استریت ژورنال در خبری از ارزیابی سازمان سیا برای آینده رهبری ونزوئلا سخن گفت.
روایت زارعی از تلاش بی‌نتیجه نماینده قم برای کارت زرد دادن به پزشکیان
نماینده تهران در مجلس از تحرکات مجتبی ذوالنوری برای پیگیری طرح سؤال از رئیس جمهور پرده برداشت.

گزارش و تحلیل

هم اکنون دیگران میخوانند