____________algorithm requires policy.

A

Supervised learning

B

 Fuzzy logic

C

Deep learning 


D

Reinforcement learning

উত্তরের বিবরণ

img

Reinforcement Learning (RL) হলো এক ধরনের মেশিন লার্নিং পদ্ধতি, যেখানে একটি এজেন্ট (agent) নির্দিষ্ট লক্ষ্য অর্জনের জন্য পরিবেশের (environment) সঙ্গে পর্যায়ক্রমিকভাবে মিথস্ক্রিয়া করে সিদ্ধান্ত গ্রহণের কৌশল শেখে

  1. মূল ধারণা: এজেন্ট তার প্রতিটি কর্মকাণ্ডের পর পরিবেশ থেকে পুরস্কার (reward) বা দণ্ড (penalty) পায়, এবং এই অভিজ্ঞতা থেকে শেখে কোন কাজগুলো কাঙ্ক্ষিত ফলাফল দেয়।

  2. নীতিমালা (Policy): এজেন্ট একটি policy অনুসরণ করে, যা নির্দেশ করে নির্দিষ্ট অবস্থায় (state) কোন কাজ (action) করতে হবে।

  3. শিক্ষণ প্রক্রিয়া: ট্রায়াল ও এরর (trial and error) পদ্ধতির মাধ্যমে এজেন্ট সময়ের সঙ্গে সঙ্গে তার কৌশল উন্নত করে, যাতে সর্বোচ্চ পুরস্কার অর্জন করা যায়।

  4. উদাহরণ: রোবটকে হাঁটতে শেখানো, স্বয়ংচালিত গাড়ির সিদ্ধান্ত নেওয়া, বা গেম খেলার অ্যালগরিদমে RL ব্যবহৃত হয়।

  5. উপাদান: RL-এর প্রধান উপাদান হলো agent, environment, policy, reward function, ও value function

Unfavorite

0

Updated: 1 day ago

Related MCQ

 In the breadth-first search, which of the following should be used?

Created: 1 day ago

A

Stack 


B

Queue 

C

Heap 


D

Heap 


Unfavorite

0

Updated: 1 day ago

 How will you declare an array (Arr) of four pointers to float?

Created: 1 day ago

A

*float Arr[4]

B

(float) Arr[*4]

C

 float *Arr[4]

D

 float *Arr[4]

Unfavorite

0

Updated: 1 day ago

 A zombie process in Unix is:

Created: 13 hours ago

A

a process whose parent has not acknowledged its exit status

B

a process waiting for l/O 

C

A process stuck In deadlock 

D

A process in an infinite loop

Unfavorite

0

Updated: 13 hours ago

© LXMCQ, Inc. - All Rights Reserved

Developed by WiztecBD