هدف کلان داده در ۱۰ سال آینده چیست؟
یکی از کارهایی که کلان داده قصد دارد در 10 سال آینده انجام دهد این است که به تمام کسانی که این کتاب را میخوانند اجازه دهد به چند ده زبان خارجی آگاه باشند و مفهوم مانع زبانی را از میان ببرد.
سابق بر این وقتی به خارج سفر میکردم یک لغت نامه جیبی کوچک برمیداشتم که ترجمههایی برای عبارات و کلمات رایج فراهم میکرد. اگر میخواستم جمله بسازم، 5 دقیقه لغت نامه را ورق میزدم تا یک عبارت منسوخ شده با افعال صرف نشده ایجاد کنم و بهترین برآوردم از (تلفظ) اسم صحیح را میگفتم.
اما امروزه تلفن همراهم را بیرون میآورم و عبارتی را در گوگل ترنسلیت تایپ میکنم که ترجمهای را به 90 زبان، با سرعتی که ارتباط اینترنتی من بتواند فراهم کند، برمیگرداند.
نتیجه معمولا خوب یا به اندازه کافی خوب است. وقتی نمیتوانم چیزی را بگویم، صفحه گوشی را نگه میدارم و همکار غیرانگلیسی زبان من میتواند آنچه را نمیتوانم بگویم، بخواند.
البته تلفظ من به زبانهای دیگر اصلا خوب نیست و انسجام ندارد، من در یک زمان تنها میتوانم دو جمله بسازم و هیچ ایدهای ندارم که دیگران در پاسخ به آن به من چه خواهند گفت. اساسا این وضع تا آن اندازه خوب است تا بپرسیم حمام کجا است و سپس امیدوار باشیم یک نفر به جهت درستی اشاره کند.
ترجمه ماشینیِ امروزی سریعتر و کارآمدتر از روش لغت نامه قدیمی من پیشرفت میکند، اما هنوز دچار نقصان دقت، عملکرد و رساندن (معنی) است. در اصل، این کمی بیشتر از یک مشکل دادهای و محاسباتی است.
استدلال اشتباه مترجمان از ترجمه ماشینی
مترجمان حرفهای استدلال میکنند که گویشهای محلی، صرف افعال و ریزه کاریها برای رایانهها پیچیده تر از آنی هستند که هرگز به حد کفایت و کمال برسند. اما آنها اشتباه میکنند!
ابزارهای ترجمه امروزی با محاسبه بیش از یک میلیارد ترجمه برای بیش از 200 میلیون نفر در روز، توسعه داده شدهاند. با رشد نمایی دادهها، این تعداد به زودی برابر با عدد ترجمههای انجام شده در یک بعدازظهر و سپس یک ساعت خواهد بود. مقادیر گسترده دادههای زبانی داخل و خارج خواهند شد.
در شرایطی که مقدار دادههایی که ترجمه را مشخص میکند به شکل نمایی رشد کند، ماشینها به طور نمایی دقیقتر خواهند شد و قادر خواهند بود کوچکترین جزئیات را تجزیه کنند.
هرجا که ترجمههای ماشینی اشتباه کنند، کاربران میتوانند بر آن خطا تاکید کنند و این دادههای جدید نیز در فرصتهای بعدی به کار گرفته میشوند.
ما تنها به دادههای بیشتر، قدرت محاسباتی بیشتر و نرمافزارهای بهتری نیاز داریم. این موارد با گذشت زمان حاصل خواهند شد و شکافهای ارتباطی را در حوزههایی که شامل تلفظ و تفسیر یک پاسخ شفاهی میشوند پر خواهند کرد.
جالبترین نوآوری ترجمه ماشین تا سال ۲۰۲۵
جالبترین نوآوریها در ترجمه ماشین با دخالت و تعامل انسان همراه خواهد بود. در طی 10 سال، یک هدفون کوچک تقریبا همزمان با صحبت شخص خارجی زبان ، آنچه را که گفته میشود، به زبان بومی شما نجوا خواهد کرد.
وقفه زمانی آن برابر با سرعت صوت خواهد بود که غیرقابل تشخیص است!
صدای درون گوشتان یک صدای رایانهای یا سیری نخواهد بود.
زمانی که دیگر محدودیت زبانی در جهان وجود نخواهد داشت!
از آنجا که پیشرفتهای مهندسی بیوآکوستیک فرکانس، طول موج، شدت صدا و ویژگیهای دیگر صدا را اندازه میگیرد، نرمافزاری که به صورت ابری به هدفونی در گوشتان متصل شده بار دیگر صدای فرد سخنگو را خلق خواهد کرد، اما به زبان بومی شما صحبت میکند.
وقتی شما پاسخ میدهید، زبان شما از طریق هدفون همتای شما به زبان وی ترجمه میشود یا با یک بلندگو در تلفن، ساعت یا هر وسیله شخصی که در سال 2025 دارید، تقویت میشود.
ابزارهای ترجمه امروزی همچنین معمولا تنها بین دو زبان کار میکنند. تلاش برای درگیر شدن در هر نوعی از تمرین برای ترجمه ماشین که شامل سه زبان باشد، آشفتگی غیر منسجمی ایجاد میکند.
در آینده، تعداد زبانهایی که صحبت میشوند اهمیتی نخواهد داشت. شما میتوانید میزبان مهمانی شامی با 8 نفر باشید که به 8 زبان مختلف صحبت میکنند و صدای درون گوشتان همیشه آن زبانی را که میخواهید بشنوید نجوا میکند.
ترجمه ماشینی همگانی، جهانی شدن را در مقیاس وسیعی شتاب خواهد داد.
در حالی که وضعیت فعلی جهانی شدن به گونهای حرکت میکند که هیچ بخش کوچکی بدون تطبیق با زبان انگلیسی به عنوان زبان بینالمللی برای تجارت، وجود نداشته باشد ( تا جایی که تعداد افراد غیر بومی که به زبان انگلیسی صحبت میکنند، دو برابر انگلیسی زبانان بومی است) موج بعدی جهانی شدن ارتباطات را از طریق حذف نیاز به یک زبان مشترک، گسترده تر نیز خواهد کرد.
در حال حاضر، وقتی فعالان کسب و کار کرهای زبان با مدیران ماندارین زبان در کنفرانسی در برزیل صحبت میکنند، با زبان انگلیسی مکالمه میکنند. با باز شدن باب برای غیرنخبگان و تعداد گسترده غیرانگلیسی زبانان به دنیای کسب و کارهای جهانی، دیگر چنین نیازی وجود نخواهد داشت.
آثار منفی پیدایش ترجمه ماشینی
ترجمه ماشینی همچنین بازارهایی را که به دلیل موانع زبانی به سختی قابل برنامه ریزی شدن هستند، درگیر خواهد کرد و آنها را قابل دسترس تر میکند.
من به ویژه به اندونزی فکر میکنم. در جاکارتا و بالی تعداد زیادی به زبان انگلیسی، ماندارین و فرانسوی صحبت میکنند.
اما در اغلب 6 هزار جزیره مسکونی دیگر این کشور تعداد بسیار معدودی از آنها زندگی میکنند. اگر کسی برای انجام کسب و کار در استانهای دیگر نیازی به مسلط بودن بر زبان جاوهای (یا هر یک از 700 زبان دیگری که در اندونزی صحبت میشود) نداشته باشد، پس فورا دسترسی بیشتری به آنها به وجود میآید و سرمایه گذاری خارجی نیز به نوبه خود برای آنان در دسترس پذیرتر میشود.
دقیقا در کنار دریاهای باندا و آرافورا در شرق اندونزی، کشور غنی از منابع پاپوآ گینه نو وجود دارد.
پاپوآ گینه نو پر از تودههای معدنی، زمین مساعد کشاورزی و آبی پر از غذاهای دریایی ارزشمند (شامل 18 درصد ماهی تن جهان) است، اما وجود 850 زبان در آن موجب ترس اغلب سرمایه گذاران خارجی میشود. استفاده از کلان داده برای ترجمه این موضوع را تغییر خواهد داد. این کار بخشهای منزوی شده اقتصادی جهان را در بر گرفته و به آنها کمک میکند تا وارد اقتصاد جهانی شوند.
همانند هر فناوری جدیدی، پیدایش ترجمه ماشینی همگانی شده آثار منفی نیز خواهد داشت، که به ویژه دو مورد به ذهن میرسند.
۱- بیکار شدن مترجمان حرفهای در ۱۰ سال آینده
نخستین مورد در معرض تخریب قرار گرفتن و محو شدن یک حرفه است. تنها مترجمان حرفهای 10 سال آینده افرادی خواهند بود که در زمینه نرم افزار ترجمه کار خواهند کرد.
اغلب برنامههای ترجمه ماشینی (مانند برنامه گوگل) شدیدا به ترجمههای انسانی وابسته خواهند ماند، اما وقتی مجموعه دادههای ترجمه به اندازه کافی بزرگ شوند، دیگر به مترجمان نیازی نخواهد بود.
شغل مترجمان حرفهای میتواند همان مسیر چراغ روشن کنها و توزیع کنندگان یخ را طی کند، یا میتواند مانند مشاغل معدنچیان زغال سنگ امروزی شود؛ هنوز به تعداد اندکی از آنها نیاز است تا بر ماشینی که زغال سنگ را از زمین استخراج میکند، نظارت کنند.
تصور میکنم تعداد اندکی هم از مترجمان حرفهای با ماشینها کار کنند تا به اصطلاحات عامیانه و مختصری که همیشه وارد سیستم زنده زبان میشوند، رسیدگی کنند.
من دیپلماتهایی را در وزارت امور خارجه به یاد میآورم که از پیشنهاد من در مورد این که هنگام سخنرانی هیلاری کلینتون، ترجمه ماشینی از نطقهای وی تهیه شود، تا بتوان گستردهتر و بلافاصله به گوش جهانیان رسانید، وحشت زده شدند.
بیشتر بخوانید: اینترنت و امنیت | از جنگ ملتها تا اینترنت اشیاء
آنها اعلام کردند که این موضوع هرگز اتفاق نخواهد افتاد. دیپلماتها حق داشتند که بگویند راه حلهای بی درنگ امروزی به اندازه کافی خوب نیستند و خطاها ممکن است حتی جنجال دیپلماتیک به پا کنند. با این حال آنها در مورد این که چنین اتفاقی هرگز نخواهد افتاد، اشتباه میکردند. تنها مساله زمان است.
۲- افزایش ریسک کلاهبرداری
دومین اثر منفی، افزایش ریسک کلاهبرداری است. اگر صدای من را بتوان به گونهای بازسازی و تقلید کرد که تشخیص صدای بازسازی شده از صدای «واقعی» من دشوار باشد، فرصتهای جدیدی برای کلاهبرداری ایجاد میشود، احتمال کلاهبرداری به چندین زبان مختلف بیشتر و نه کمتر میشود.
در جهانی که ترجمه و ارتباطات تقریبا همگانی میشوند، یک اثر جانبی کنایه آمیز شاید این باشد که لازم است بتوانیم به چشمان یک نفر نگاه کنیم تا آنچه را میگوید باور کنیم.