আপনি কি মনে করতে পারেন গুগল ট্রান্সলেট (Google Translate) প্রথম কবে ব্যবহার করেছিলেন? হয়তো ১০ বা ১৫ বছর আগে। এতদিন আমাদের অভ্যাস ছিল টেক্সট লিখুন, অনুবাদ করুন, তারপর কপি করুন। অথবা কথা বলুন, থামুন, অনুবাদ শুনুন, তারপর আবার বলুন। ২০ বছর ধরে অনুবাদ এভাবেই কাজ করেছে। কিন্তু আজ থেকে সেই চিরচেনা নিয়ম বদলে গেল।
গুগল গতকাল তাদের নতুন এআই মডেল রিলিজ করেছে জেমিনি ৩.৫ লাইভ ট্রান্সলেট (Gemini 3.5 Live Translate)। এটি শুধু অনুবাদ করে না, বরং আপনার কথার সাথে সাথে (Real-time) অনুবাদ করতে থাকে। আপনি কথা বলছেন, আর ওপাশে এআই সেই কথাগুলো অন্য ভাষায় শুনিয়ে দিচ্ছে। আপনাকে আর অনুবাদের জন্য থামতে হবে না।
এতদিন গুগল ট্রান্সলেট বা অন্য সব সিস্টেমে আপনি একটি বাক্য বলার পর থামতেন, এআই সেটি প্রসেস করত এবং তারপর অনুবাদ শোনাত। এই 'পজ' বা বিরতিটি কথোপকথনকে খুব অস্বস্তিকর (Awkward) করে দিত।
জেমিনি ৩.৫ লাইভ ট্রান্সলেট-এ আপনি যখন কথা বলছেন, এআই একই সাথে সেটি অনুবাদ করছে। ওপাশে থাকা ব্যক্তিটি আপনার কথা থামার আগেই অনুবাদ শুনতে পাচ্ছেন। সবচেয়ে বড় চমক হলো, এটি আপনার গলার স্বর (Pitch), কথার গতি এবং টোন সবকিছু হুবহু বজায় রেখে অনুবাদ করে।
আগে গুগল ট্রান্সলেট বেশিরভাগ সময় বাংলা থেকে জাপানিজ অনুবাদ করতে গেলে প্রথমে বাংলাকে ইংরেজিতে এবং তারপর ইংরেজিকে জাপানিজে অনুবাদ করত। এতে অনুবাদের মান কমে যেত।
এখন জেমিনি ৩.৫ লাইভ ট্রান্সলেট সরাসরি বাংলা থেকে জাপানিজ বা অন্য ৭০টিরও বেশি ভাষায় অনুবাদ করতে পারে। এতে ২,০০০-এর বেশি ল্যাঙ্গুয়েজ কম্বিনেশন সম্ভব। এমনকি আপনি যদি একই কথায় তিন-চারটি ভাষা মিশিয়ে বলেন, এআই নিজেই তা শনাক্ত করে নেবে।
কীভাবে এবং কোথায় ব্যবহার করবেন?
> গুগল ট্রান্সলেট অ্যাপ (Android + iOS): আজ থেকেই সবার জন্য এটি ফ্রি-তে উন্মুক্ত করা হয়েছে।
> হ্যান্ডস-ফ্রি মোড: অ্যান্ড্রয়েড ইউজাররা ফোনের ইয়ারপিস ব্যবহার করে কোনো বাটন না চেপেই কানে ধরে কথা বলতে পারবেন।
> গুগল মিট (Google Meet): এন্টারপ্রাইজ কাস্টমারদের জন্য এই মাসেই প্রিভিউ শুরু হচ্ছে। ২০২৬-এর শেষে এটি সবার জন্য আসবে।
> রিয়েল-ওয়ার্ল্ড ইউজ: দক্ষিণ-পূর্ব এশিয়ার জনপ্রিয় রাইড-হেলিং সার্ভিস গ্র্যাব (Grab) ইতিমধ্যে এটি ব্যবহার করছে। তাদের প্ল্যাটফর্মে ড্রাইভার এবং প্যাসেঞ্জার আলাদা ভাষায় কথা বললেও এআই মাঝখানে থেকে রিয়েল-টাইমে সব অনুবাদ করে দিচ্ছে।
> নিরাপত্তা: গুগল এখানে SynthID Watermark ব্যবহার করছে। এটি এআই দিয়ে তৈরি অডিওতে একটি অদৃশ্য জলছাপ দিয়ে দেয়, যাতে কেউ এই টেকনোলজি ব্যবহার করে কারো নকল অডিও বানিয়ে অপব্যবহার করতে না পারে।
বাংলাদেশের জন্য এর গুরুত্ব
১। ভাষার বাধা দূরঃ আমাদের ১৭ কোটি মানুষের জন্য এটি এক বিশাল সুযোগ। ইন্টারন্যাশনাল বিজনেস কল, বিদেশি ক্লায়েন্টের সাথে মিটিং বা বিদেশে গিয়ে ডাক্তারের সাথে কথা বলা এখন সবকিছু হবে বাংলায়। আপনি বলবেন বাংলায়, ওপাশে তারা শুনবে তাদের ভাষায়।
২। পেশাদার ইন্টারপ্রেটারদের ভবিষ্যৎঃ সাধারণ মিটিং বা ভ্রমণের জন্য এখন আর ইন্টারপ্রেটার লাগবে না। তবে জটিল মেডিকেল বা আইনি কাজের জন্য এখনো মানুষের প্রয়োজন থাকবে।
৩। অ্যাপল বনাম গুগল যুদ্ধ: গতকাল ডব্লিউডব্লিউডিসি-তে অ্যাপল সিরি-র ট্রান্সলেশন ফিচার দেখানোর ঠিক পরেই গুগল এই রিয়েল-টাইম স্পিচ ট্রান্সলেশন নিয়ে এলো। এআই অনুবাদের এই যুদ্ধ এখন তুঙ্গে।
বছরের পর বছর আমরা সায়েন্স ফিকশনে দেখেছি 'ইউনিভার্সাল ট্রান্সলেটর' যেখানে যে কেউ যেকোনো ভাষায় কথা বললে অন্যজন তা বুঝতে পারে। আজ সেই সায়েন্স ফিকশন আপনার হাতের ফোনে সত্যি হয়ে ধরা দিল। ২০ বছর ধরে গুগল যে যাত্রা শুরু করেছিল, আজ তা এক সার্থক রূপ পেল।
কিছু সীমাবদ্ধতা 👇
বাংলা ভাষা সহ ৭০+ সাপোর্টেড ল্যাঙ্গুয়েজে থাকলেও সব অঞ্চলের উপভাষা (Dialect) বা জটিল অ্যাকসেন্ট এআই নিখুঁতভাবে বুঝতে কিছুটা সময় নিতে পারে। এছাড়া গুগল মিট-এ সবার জন্য এটি আসতে ২০২৬-এর শেষ পর্যন্ত অপেক্ষা করতে হতে পারে। মনে রাখবেন, ফ্রি সার্ভিসের মানে হলো গুগল আপনার অডিও ডেটা প্রসেস করছে, তাই প্রাইভেসির বিষয়টি মাথায় রাখা জরুরি।
আপনার জীবনে ভাষার বাধার কারণে সবচেয়ে বড় সমস্যা কোথায় হয়েছে? ইন্টারন্যাশনাল কল, মিটিং নাকি বিদেশে ভ্রমণে? কমেন্টে আপনার অভিজ্ঞতা শেয়ার করুন! 👇
আর এমন Exclusive Tech, AI, and Social Media News পেতে ফলো করুন এবং পোস্টটি শেয়ার ও সেভ করুন 🙏
Collected post
Comments
Post a Comment