অ্যান্ড্রয়েড

ওপেনই বটকে কী শক্তি দেয় যা ডেন্ডিকে পরাজিত করে

OPEN AI - SKYNET CỦA DOTA 2? | HISTORY OF OPEN AI

OPEN AI - SKYNET CỦA DOTA 2? | HISTORY OF OPEN AI

সুচিপত্র:

Anonim

গত সপ্তাহে, ইতিহাসটি ডোটা 2 এবং এআইয়ের রাজ্যে তৈরি হয়েছিল। ইন্টারন্যাশনাল-এ, খেলার অন্যতম সেরা খেলোয়াড়, দেন্ডিকে পরপর দু'বার একটি বট দিয়ে 1v1 তে নির্দয়ভাবে পরাজিত করেছিল। ইলন কস্তুরীর প্রারম্ভিক ওপেনএইআই দ্বারা প্রশ্নবিদ্ধ বট তৈরি করা হয়েছে।

এখন আপনার কিছু প্রশ্ন থাকতে পারে। ডোটা কী? ওপেনএআই কি? এবং কেন এটি আরও গুরুত্বপূর্ণ? শুরু করার জন্য, ডোটা হ'ল একটি ফ্রি-টু-প্লে এমওবিএ গেম যাতে আপনি হিরোদের নিয়ন্ত্রণ করেন এবং আপনার লক্ষ্য প্রতিপক্ষ প্রাচীনকে ধ্বংস করা destroy ডোটার অনেক ভক্তই শেষ বাক্যটিকে অপরাধ হিসাবে গ্রহণ করতে পারে কারণ ডোটার পক্ষে এতটুকু আমি সংক্ষিপ্ত করে রেখেছি।

খেলাটি খুব খাড়া শেখার বক্ররেখার সাথে খুব জটিল। আমি কিছুটা আগে ডোটা শিখার মিশনে গিয়েছিলাম এবং আমার কীভাবে ভিডিও করা যায় তার বেসিকটি পেতে কেবল এক সপ্তাহ লেগেছিল, যেখানে তারা গেমটির কৌশল ব্যাখ্যা করে, কী অস্ত্র, বানান, নায়করা এবং কীভাবে ক্রিপিং করতে হয়। এবং এটি পুরো এআই বনাম ডেন্ডি যুদ্ধকে গুরুত্বপূর্ণ করে তোলে কারণ এটি চিত্রিত করে যে ঠিক কীভাবে এআই এবং এমএল উন্নত হয়েছে। সুতরাং আসুন আমরা সেই বটকে কী শক্তিশালী করে দেখছি এবং এআই বিদ্রোহ সম্পর্কে আমাদের কী ভয় পাওয়ার দরকার?

এআই এর প্ল্যানেট এর উত্থান

স্কাইনেট হয়ে ওঠা একটি বিতর্কিত সমস্যা। ইলন কস্তুরী বিশ্বাস করেন যে যদি এটি না রাখা হয় তবে স্কাইনেটের মতো দৃশ্যের সম্ভাবনা রয়েছে। অন্যদিকে, মার্ক জুকারবার্গ বলেছেন যে এআই নিরীহ এবং এটি ডুমসডে সিনারিও সৃষ্টি করবে না। এলোন কস্তুরী এই গোলটি দিয়ে ওপেনএইআই শুরু করেছিলেন।

এআই এর অপব্যবহার রোধ করতে এবং এআইতে গবেষণা করা যা আমাদের বিরুদ্ধে পরিণত হবে না। আর আমি তার পাশে আছি।

তবে আমরা এখানে যে আলোচনা করব তা নয়। মূল বিষয়টি ওপেনএআইএর তৈরি বটটি কী শক্তি প্রয়োগ করছে তা জানা know এর বোঝাপড়া পাওয়ার জন্য, আমি এই বিষয়টিতে কয়েকটি গবেষণা পত্র এবং ব্লগ পড়েছি এবং আমার বন্ধু আনমল শর্মার সাথে যোগাযোগ করেছিলাম, যিনি একজন এআই এবং এমএল গবেষক is

শক্তিবৃদ্ধি শেখা

এটি ওপেনএআইএর ডোটা বটের পিছনে কারিগরের নাম। তবে আমাদের তা জানার আগে আমাদের বুঝতে হবে যে ভিডিও গেমসে সাধারণ এআই, বা বিশেষত এআই কীভাবে কাজ করে। এআই একটি খুব বোর্ড শর্ত এবং এতে কয়েকটি নাম রাখার জন্য মেশিন লার্নিং, ডিপ লার্নিং এবং নিউরাল নেটওয়ার্কের মতো অনেকগুলি বিষয় রয়েছে। অযৌক্তিকভাবে এআইকে সংজ্ঞায়িত করতে, আমরা বলতে পারি যে এটি কম্পিউটারের তথ্য থেকে শেখার এবং তার শেখার উপর ভিত্তি করে সিদ্ধান্ত নেওয়ার ক্ষমতা। এটি যত বেশি শিখবে, ততই তার সিদ্ধান্তের সঠিকতা বৃদ্ধি পায়।

এটি সাধারণ বটের চেয়ে কীভাবে আলাদা?

সাধারণ ভিডিও গেমের বটগুলি দেখতে বুদ্ধিমানের মতো দেখায় তবে এটি এআই এর প্রকৃত রূপ নয়। গেমগুলিতে এই সমস্ত বটগুলি প্রায়শই সেট ইফ..তী..তিন..এর বক্তব্যের ভিত্তিতে প্রোগ্রাম করা হয়। তারা কেবল বিবৃতি অনুসরণ করে বিবৃতিতে লিখিত শর্তের ভিত্তিতে পদক্ষেপ নেয়।

উপরে আমি খুব সাধারণ উদাহরণ দেখিয়েছি। বাস্তব গেমগুলির বিবৃতি শর্তের মধ্যে অবস্থার সাথে আরও জটিল। এই বিবৃতিগুলি যত বেশি সংজ্ঞায়িত এবং বিস্তারিত, বট তত বুদ্ধিমান বলে মনে হবে।

পুরষ্কার এবং শাস্তি

এআই লিঙ্গোতে, আমরা বট হিসাবে যাকে বলে থাকি এটি একটি এজেন্ট হিসাবে পরিচিত। লক্ষ্যটি হ'ল এজেন্টটি যা শিখতে চাই তা শেখা। এজেন্ট আপনার কুকুর যেমন শিখেছে তেমনি পুরষ্কার এবং শাস্তির মাধ্যমে শিখবে method এজেন্ট যখনই কোনও ভুল করে তখন এটি দন্ডিত হয় এবং যখনই এটি সঠিক অনুমান করে বা সঠিক উত্তর দেয়, তবে এটি পুরস্কৃত হয়। এই সিস্টেমের মাধ্যমে, এজেন্ট সেই ক্রিয়াকলাপগুলি সংযুক্ত করতে শেখে যা শাস্তি এড়াতে এবং পুরষ্কার দেয় এমন ক্রিয়া (বা অনুরূপ ক্রিয়া) সম্পাদন করা উচিত নয়।

আপনি যদি এটি ঘনিষ্ঠভাবে চিন্তা করেন তবে এটি ঠিক কিছু শর্তের ভিত্তিতে সিদ্ধান্ত নেওয়ার মতো, অনেকটা অ্যালগরিদম যেমন করে। যেমন আমি উপরে দেখিয়েছি, একটি গেম বট, একটি বিস্ফোরক ব্যারেলের উপর এসে আলগোরিদিম অনুযায়ী পদক্ষেপ নেবে। এআই এর অ্যালগরিদমগুলি স্পষ্টতই এর থেকে অনেক জটিল, যা পুরো সিস্টেমটিকে বুদ্ধিমান করে তোলে।

বিকাশকারীদের মতে, আমাদের ওপেনএআইএ বট-এ এসে 2 সপ্তাহের মধ্যে পুরো খেলাটি শিখেছে learned 2 সপ্তাহের পুরো সময়ের মধ্যে, এটি অনলাইনে 24 × 7 ছিল এবং এটি নিজের অনুলিপিটির বিরুদ্ধে খেলছে। গেমটির জটিলতা এবং এটি ডেন্ডিকে পরাজিত করতে পারে এই বিষয়টি বিবেচনা করে এটি একটি উল্লেখযোগ্য মাইলফলক।

ড্রাইভার-কম গাড়ি এখনও এখানে নেই কেন?

আমি যখন এই পুরো ঘটনাটি শুনেছিলাম তখন এটি আমার মনে প্রথম যে প্রথম প্রশ্নটি ছড়িয়ে পড়েছিল of যদি কোনও বট এই জাতীয় খেলা শিখতে পারে এবং শীর্ষ খেলোয়াড়দের মারধরের একটি বিন্দুতে নিজেকে প্রশিক্ষণ দিতে পারে তবে আমরা কেন চাকাটি চালাচ্ছি? এবং এটিই আমি আমার বন্ধু মিঃ আনমল শর্মাকে গুলি করেছিলাম, যিনি চালকবিহীন গাড়ি নিয়েও গবেষণা করেছেন। এই তিনি বলার ছিল কি না।

একটি খেলায়, এটি একটি মানুষের দ্বারা বিকশিত হয়েছে, ভেরিয়েবলের সংখ্যা কম are এছাড়াও, যদি এজেন্ট (বট) কোনও ভুল করে, তবে সবচেয়ে খারাপ জরিমানাটি একটি গোল ক্ষতি। বাস্তব বিশ্বে একটি ভুল হল মৃত্যু।

যদিও ডোটা একটি জটিল খেলা, চলন, মন্ত্র এবং কৌশলগুলির সম্ভাব্য সংমিশ্রণগুলি এখনও অযৌক্তিকভাবে বড় হলেও এখনও সীমাবদ্ধ। এবং ভুলগুলি কোনও বাস্তব জরিমানা ছাড়াই অনুমোদিত। তবে ড্রাইভার-কম গাড়ি এজেন্টের ক্ষেত্রে ভুলগুলি বিপজ্জনক দুর্ঘটনা এমনকি মৃত্যুর কারণও হতে পারে।

বাস্তব বিশ্বে, এজেন্টকে যে ভেরিয়েবলগুলি পর্যবেক্ষণ করতে হবে তার সংখ্যা অবিরাম এবং এই ভেরিয়েবলগুলির কারণে পরিস্থিতি ছড়িয়ে পড়ছে, অন্য গাড়ি যেমন হঠাৎ বদলে গেছে লেন, গাড়ির সামনে পথচারী ঝাঁপ দেওয়া, তাও অন্তহীন। এছাড়াও, জেরেমি ক্লার্কসন যেমন বলেছিলেন, তাত্ক্ষণিক দুর্ঘটনার পথে যাওয়ার সময় তাদের নৈতিক ও নৈতিক সিদ্ধান্ত নিতে হবে (যদিও তার তত্ত্বটি বৈধ নয়)।

ভবিষ্যৎ

আমরা ইতিমধ্যে মানব নিয়ন্ত্রিত রোবট অন্তর্নিহিত সার্জারি সম্পাদন সম্পর্কে জানি। পরবর্তী লিপ এটি সম্পাদন করছে এআই-নিয়ন্ত্রিত রোবটগুলি। এবং এটি কেবল চিকিত্সা ক্ষেত্রে। এআই নিশ্চিতভাবেই আগামী এক দশকে অনেকগুলি ক্ষেত্রে প্রভাবশালী নতুন প্রযুক্তি হবে। কিন্তু, ডিআইওএস আক্রমণ, র্যানসোমওয়্যার বটস এবং অন্যান্য পিসি বা কর্পোরেশনগুলির সিস্টেম হ্যাক করার মতো নেতিবাচক উদ্দেশ্যেও এআই এর অপব্যবহার করা যেতে পারে।

ডোটা এবং অন্যান্য গেমসের ক্ষেত্রে আমরা অন্যান্য গেমের জন্যও এমন বুদ্ধিমান বট তৈরি করা আশা করতে পারি, যার বিরুদ্ধে খেলোয়াড়রা আরও ভাল পারফর্ম করার প্রশিক্ষণ নিতে পারে। এবং আমি কী উল্লেখ করেছি যে ওপেনএইআই পরবর্তী বছরের আন্তর্জাতিক সময়ে 5v5 করবে? তাই অন্তত অন্তর্নির্মিত ডাম্বার বটগুলিকে পরাস্ত করতে আমি আমার ডোটা দক্ষতা ব্রাশ করতে চলেছি। ডিভাইন রেপিয়ার আমি এখানে আসি!