Car-tech

স্পিচ রিকগনিশন সিস্টেমগুলি চূড়ান্ত লাভ করতে হবে, অধ্যাপক ড।

মার্শাল আর্ট 5 মাস্টার্স

মার্শাল আর্ট 5 মাস্টার্স
Anonim

যারা অটোমেটেড স্পিচ স্বীকৃতি ব্যবস্থায় ফোনে কথা বলা ঘৃণা এই সত্য যে সায়েন্টিস্টরা এই ধরনের সিস্টেমগুলি আরো lifelike এবং কম বিরক্তিকর ব্যবহারের জন্য কাজ করছে তা সান্ত্বনা নিতে পারে।

"ভোক্তা অভিজ্ঞতা থেকে, মানুষ এই সিস্টেমগুলি খুব হতাশাজনক দেখতে পায়," জেমস বলেন অ্যালেন, রচেস্টার ইউনিভার্সিটির কম্পিউটার বিজ্ঞান বিভাগের চেয়ারম্যান যিনি এই সপ্তাহে নিউইয়র্কে অনুষ্ঠিত স্পেটিটিইক কনফারেন্স 2010 এর আগে বক্তব্য রাখেন।

বেশীরভাগ কম্পিউটারাইজড স্পিচ স্বীকৃতি সিস্টেম বুঝতে পারে যে 98 শতাংশের বেশি মানুষ কী বলে, এবং এখনও মানুষ এখনও স্বয়ংক্রিয় ফোন হেল্প-ডেস্ক সিস্টেমে ব্যবহার করে ক্ষুব্ধ। এই সিস্টেমে কম হতাশাজনক ব্যবহারের জন্য কী কী ভাষা ব্যবহার করা যায় এবং তাদের আরও বেশি ইন্টারেক্টিভ করে দিয়ে এলেন বলেন।

[আরও পড়ুন: আপনার নতুন পিসিটি এই 15 টি বিনামূল্যে, চমৎকার প্রোগ্রামগুলির প্রয়োজন]

এখন পর্যন্ত, বেশিরভাগ বড় সংস্থার গ্রাহক পরিষেবা বিভাগগুলি স্বয়ংক্রিয় ফোনের ভিত্তিক সহায়তা ব্যবস্থা প্রদান করে। একটি ব্যবহারকারী সহায়তা সংখ্যা আহ্বান করে এবং একটি কৃত্রিম ভয়েস কলকারী প্রশ্ন একটি সিরিজ জিজ্ঞাসা। বেশিরভাগ সিস্টেমই মূলত বড় সিদ্ধান্ত গাছ যে কাঠামো উপর ভিত্তি করে। যেমন সিস্টেমের সাথে, "আপনি কি চান তা খুঁজে না পান, আপনি একটি স্ক্রিপ্ট অনুসরণ করছেন," তিনি বলেন।

সিস্টেম আসলে বিভিন্ন প্রযুক্তির একটি সংমিশ্রণ হয়। একজন স্পিকারের কথোপকথনটি কীভাবে বোঝাচ্ছে তা বোঝার জন্য একটি কম্পিউটারের দক্ষতা বা কম্পিউটারের দক্ষতা, অথবা সফলভাবে পাঠ্যে অনুবাদ করা হয়।

অন্য প্রযুক্তি, প্রাকৃতিক ভাষা প্রসেসিং (এনএলপি), স্পিকারের বার্তাটি একটি কমান্ডে রূপান্তর করার চেষ্টা করে যে কম্পিউটারটি চালানো যায়, অথবা এটি মানুষের অপারেটরের জন্য সংক্ষিপ্ত করা যেতে পারে।

গত কয়েক দশক ধরে ভয়েস স্বীকৃতি ও এনএলপি উভয়ের মধ্যে ব্যাপক অগ্রগতি হয়েছে, তবে তারা বেশিরভাগভাবে তাদের ব্যবহারকারীদের কাছে হতাশা নিয়ে আসে। "আমি কেবল ব্যাঙ্ককে বলি যখন আমার সমস্যা হয় এবং এই পদ্ধতিগুলি যুদ্ধ করে। [আমি জিজ্ঞাসা করি] যত দ্রুত সম্ভব একজন ব্যক্তির মাধ্যমে আমি যা করতে পারি তার উত্তর দিতে পারি", অ্যালেন বলেন।

অ্যালেনের একাডেমিক গবেষণা কাজ হয়েছে তিনি বলেন, "আমরা একটি মেশিনের সাথে একই ব্যক্তির সাথে কথা বলতে পারি এমনভাবে কথা বলতে পারি।"

কম্পিউটারের সাথে মেলামেশা করতে অসুবিধা হওয়ার কারণে দুজন ব্যক্তির মধ্যে কথোপকথন সঠিক হতে পারে। অ্যালেন কিছু প্রাথমিক কাজ সম্পর্কে উল্লেখ করেন যে তিনি একটি স্নাতক ছাত্র হিসাবে করেছেন, যেখানে তিনি ট্রেন স্টেশন তথ্য ডেস্ক এ কথোপকথন রেকর্ড। এক মিথস্ক্রিয়া মধ্যে, একটি যাত্রী বুথ আপ পদব্রজে ভ্রমণ এবং "উইন্ডসর থেকে 8:50" বলছেন, এবং পরিচর্যা উত্তর "গেট 10, 20 মিনিট দেরি।" যদিও পরিদর্শক জানতেন যে অনুসন্ধানকারী কি কি জানতে চেয়েছেন, কম্পিউটারাইজড সিস্টেমগুলি যাত্রীদের প্রথম বিবৃতিটি উজ্জ্বল করবে।

অ্যালেন যেভাবে দেখছেন তা হল আধুনিক সিস্টেমগুলি থেকে দুটি উপাদান অনুপস্থিত: স্পিকার কী বলছে তা বিশ্লেষণ করার ক্ষমতা এবং স্পিকারের সাথে কথা বলার জন্য স্পিকারের সাথে কথা বলার ক্ষমতা।

"অফ-দ্য-শেফ এনএলপিটি প্রচুর পরিমাণে অগভীর হয়ে থাকে। আমাদের এমন প্রযুক্তি নেই যা আপনাকে বাক্যগুলির অর্থ দেয়" সে বলেছিল. স্ট্যাটিস্টিকাল প্রসেসিং টুলস এবং ওয়ার্ডনেটের মতো শব্দ সংজ্ঞা পরিষেবা যেমন শব্দটি সংজ্ঞায়িত করতে পারে কিন্তু শব্দটির সম্পর্কও ব্যাখ্যা করে, তাই সিস্টেমটি জানাবে যে, উদাহরণস্বরূপ, একটি "সহায়ক" একটি "কোম্পানির" অংশ।

আরও ব্যবহারকারী এবং কম্পিউটারের মধ্যে দ্বিপথ যোগাযোগের প্রয়োজন হয়। তাদের প্রয়োজনগুলি সম্পর্কে কথা বলার সময়, লোকেরা কোনও নির্দিষ্ট ক্রমে তথ্য সরবরাহ করতে পারে না। এটা এই তথ্য একসাথে টুকরা করা কম্পিউটারে হওয়া উচিত এবং প্রশ্নগুলির উত্তর দিয়ে ব্যবহারকারীকে বোঝায় না।

"এটি ভবিষ্যৎ, এটি আসলেই আপনি যা চান সিস্টেমগুলি করতে চান, এবং আমরা ডায়লগ তৈরি করতে পারি সিস্টেমগুলি এই জটিল জটিলতাকে সমর্থন করতে পারে ", তিনি বলেন।

এই ধারণাটি ব্যাখ্যা করার জন্য, অ্যালেন এবং গবেষকদের একটি দল কার্ডিয়াক নামে একটি প্রোগ্রাম ডিজাইন করেছে যাতে প্রশ্নগুলির একটি নমুনা হৃদরোগের রোগীর সাথে জিজ্ঞাসা করতে পারে। মার্কিন যুক্তরাষ্ট্রের ন্যাশনাল ইনস্টিটিউট অব হেলথের কাছ থেকে তহবিল সংগ্রহের মাধ্যমে প্রোগ্রামটি তৈরি করা হয়েছিল। এই সিস্টেমের সাথে, ব্যবহারকারী একবার তথ্য সরবরাহ করে, সিস্টেম আবার জন্য এটি জিজ্ঞাসা করা হবে না, অ্যালেন বলেন। সিস্টেমটি কি ইতিমধ্যে উপাদান সরবরাহ করা হয়েছিল এবং এখনও কি প্রয়োজন তা নিয়ে চিন্তা করবে।

অ্যালেন এবং তার দল দ্বারা পরিকল্পিত আরেকটি প্রোগ্রাম, প্লো বলা হয়, কম্পিউটারে সাধারণ কাজগুলি সম্পন্ন করার পদ্ধতি শিখতে পারে। "এটি এমন একটা ব্যবস্থা যা মূলত আপনার সিস্টেমকে প্রশিক্ষিত করার জন্য ডায়ালগ ব্যবহার করতে দেয় যা আপনার জন্য কাজ করে।"

উদাহরণস্বরূপ, অ্যালেন একটি ব্রাউজার ব্যবহার করে কাছাকাছি রেস্তোরাঁগুলি কিভাবে খুঁজে বের করতে শেখার প্রোগ্রামটি দেখিয়েছেন। ব্যবহারকারী একটি ব্রাউজার খুলবে, একটি রেস্টুরেন্ট লোকেটার সাইট নেভিগেট, চাওয়া রেস্টুরেন্ট টাইপ করুন এবং অবস্থান, এবং তারপর কাটা এবং একটি ফাঁকা পাতা ফলাফল আটকান। ব্যবহারকারীটি প্রতিটি ধাপ হিসাবে বর্ণনা করা হয়েছে।

প্রক্রিয়ায়, প্লাওয়ার প্রতিটি ধাপটি রেকর্ড করবে, এবং পদক্ষেপটি বোঝা হলে শ্রবণে সাড়া দেবে। পরে, যখন ব্যবহারকারী অন্য রেস্টুরেন্টটি দেখতে চান, তখন প্রোগ্রামটি একই রকমের গতিপথে চলে যাবে, স্বয়ংক্রিয়ভাবে রেস্টুরেন্টের আরেকটি তালিকা তৈরি করবে। ইউএস ডিফেন্স অ্যাডভান্সড রিসার্চ এজেন্সী এজেন্সি এই প্রোগ্রামটির উন্নয়নে অর্থায়ন করেছে।

কনফারেন্সে আরেকটি বক্তৃতায় মাইক্রোসফ্টের প্রধান বিজ্ঞানী ল্যারি হেকের বক্তব্যের জন্য আরো মানুষের মত ভাষার প্রক্রিয়াকরণ পদ্ধতির আরো তথ্য রয়েছে। তিনি বলেন, "যদি আপনার কাছে তথ্য না থাকে তবে আপনার অ্যালগরিদমগুলি কীভাবে পরিব্যাপ্ত তা বিবেচনা করে না।"

অনুসন্ধান ইঞ্জিন প্রশ্নে আরো তথ্য সন্ধানের জন্য তিনি এক স্থান দিতেন। সার্চ ইঞ্জিন সেবাগুলি বিপুলসংখ্যক ক্যোয়ারী পেতে থাকে, যা সকলের উত্তরগুলির সাথে সংযুক্ত হয়। "আমি ভাষা প্রক্রিয়াকরণ প্রযুক্তির কাছে ঘনিষ্ট চাচাতো বোন হিসাবে অনুসন্ধান করি", হেক বলেন।

এই দিন, লোকেরা কীওয়ার্ডগুলির একটি সেট হিসাবে তাদের অনুসন্ধান গঠন করার জন্য প্রশিক্ষিত। এর পরিবর্তে, যদি ব্যবহারকারীরা তাদের প্রয়োজনগুলির বর্ণনা করে সম্পূর্ণ বাক্য টাইপ করে থাকেন, তবে ফলাফলগুলি ডেটা সেট করতে সাহায্য করে যাতে লোকেদের কীভাবে খুঁজছেন তা বুঝতে পারে।

হেক ভবিষ্যদ্বাণী করেন যে যত বেশি লোক ভয়েস অ্যাক্টিভেটেড অনুসন্ধান পরিষেবাগুলি ব্যবহার করে মাইক্রোসফট এবং গুগল থেকে, তারা আরও পূর্ণাঙ্গ বাক্য হিসাবে তাদের জিজ্ঞাসাবাদ করতে অভ্যস্ত হয়ে উঠবে, যার ফলে এনএলপি সিস্টেমের সাহায্যে আরও ব্যবহারকারীর প্রয়োজনগুলি অনুমান করা যায়।

Joab জ্যাকসন এন্টারপ্রাইজ সফটওয়্যার এবং সাধারণ প্রযুক্তি এর জন্য নিউজলেটার নিউজ পরিষেবা । Joab টুইটারে Joab_Jackson এ অনুসরণ করুন। Joab এর ইমেইল ঠিকানা [email protected]