____________algorithm requires policy.
A
Supervised learning
B
Fuzzy logic
C
Deep learning
D
Reinforcement learning
উত্তরের বিবরণ
Reinforcement Learning (RL) হলো এক ধরনের মেশিন লার্নিং পদ্ধতি, যেখানে একটি এজেন্ট (agent) নির্দিষ্ট লক্ষ্য অর্জনের জন্য পরিবেশের (environment) সঙ্গে পর্যায়ক্রমিকভাবে মিথস্ক্রিয়া করে সিদ্ধান্ত গ্রহণের কৌশল শেখে।
-
মূল ধারণা: এজেন্ট তার প্রতিটি কর্মকাণ্ডের পর পরিবেশ থেকে পুরস্কার (reward) বা দণ্ড (penalty) পায়, এবং এই অভিজ্ঞতা থেকে শেখে কোন কাজগুলো কাঙ্ক্ষিত ফলাফল দেয়।
-
নীতিমালা (Policy): এজেন্ট একটি policy অনুসরণ করে, যা নির্দেশ করে নির্দিষ্ট অবস্থায় (state) কোন কাজ (action) করতে হবে।
-
শিক্ষণ প্রক্রিয়া: ট্রায়াল ও এরর (trial and error) পদ্ধতির মাধ্যমে এজেন্ট সময়ের সঙ্গে সঙ্গে তার কৌশল উন্নত করে, যাতে সর্বোচ্চ পুরস্কার অর্জন করা যায়।
-
উদাহরণ: রোবটকে হাঁটতে শেখানো, স্বয়ংচালিত গাড়ির সিদ্ধান্ত নেওয়া, বা গেম খেলার অ্যালগরিদমে RL ব্যবহৃত হয়।
-
উপাদান: RL-এর প্রধান উপাদান হলো agent, environment, policy, reward function, ও value function।

0
Updated: 1 day ago
In the breadth-first search, which of the following should be used?
Created: 1 day ago
A
Stack
B
Queue
C
Heap
D
Heap
Breadth-First Search (BFS) হলো এমন একটি graph traversal algorithm, যা গ্রাফের নোডগুলোকে স্তরভিত্তিকভাবে (level by level) অনুসন্ধান করে। এটি একটি সূত্র নোড (source node) থেকে শুরু করে, প্রথমে তার সব প্রতিবেশী নোড ভিজিট করে, তারপর পরবর্তী স্তরের নোডগুলিতে যায়। এই প্রক্রিয়া বাস্তবায়নে ব্যবহৃত হয় Queue (FIFO – First In, First Out) ডেটা স্ট্রাকচার।
মূল ধাপগুলো হলো:
-
সূত্র নোডটি enqueue করা হয়।
-
একটি নোড dequeue করে সেটি ভিজিট করা হয় এবং তার অভিযুক্ত না হওয়া (unvisited) প্রতিবেশীদের enqueue করা হয়।
-
এই ধাপগুলো queue খালি হওয়া পর্যন্ত পুনরাবৃত্তি হয়।
উদাহরণ:
যদি গ্রাফটি হয় —
A → B, C
B → D
C → E
তাহলে BFS traversal order: A, B, C, D, E
(যেখানে কিউ ব্যবহৃত হয়েছে)।
অতএব, BFS-এ Queue ব্যবহৃত হয় নোডগুলোকে তাদের আবিষ্কারের ক্রম অনুযায়ী পরিচালনার জন্য।

0
Updated: 1 day ago
How will you declare an array (Arr) of four pointers to float?
Created: 1 day ago
A
*float Arr[4]
B
(float) Arr[*4]
C
float *Arr[4]
D
float *Arr[4]
float Arr[4] হলো এমন একটি ঘোষণাপদ্ধতি যা একটি float টাইপের চারটি পয়েন্টার ধারণকারী অ্যারে নির্দেশ করে। এটি C ভাষার ডিক্লারেশন নিয়ম অনুযায়ী গঠিত, যেখানে “array of X” এবং “function returning X” অংশগুলো “pointer to” ()-এর আগে bind হয়।
মূল বিষয়গুলো হলো:
-
Arr[4] দ্বারা বোঝায় যে Arr হলো চারটি উপাদান বিশিষ্ট একটি অ্যারে।
-
*Arr[4] বোঝায় অ্যারের প্রতিটি উপাদান একটি পয়েন্টার।
-
float *Arr[4] নির্দেশ করে প্রতিটি পয়েন্টার float টাইপের ডেটার ঠিকানা ধারণ করতে পারে।
অতএব, Arr হলো চারটি float পয়েন্টার নিয়ে গঠিত একটি অ্যারে, যা মেমরিতে চারটি আলাদা float ভেরিয়েবলের ঠিকানা সংরক্ষণে সক্ষম।

0
Updated: 1 day ago
A zombie process in Unix is:
Created: 13 hours ago
A
a process whose parent has not acknowledged its exit status
B
a process waiting for l/O
C
A process stuck In deadlock
D
A process in an infinite loop
একটি Zombie Process হলো এমন একটি প্রক্রিয়া যা নিজের কাজ সম্পন্ন করেছে, কিন্তু এখনো Process Table–এ এন্ট্রি হিসেবে রয়ে গেছে, কারণ এর Parent Process এখনো তার exit status acknowledge (wait() system call) করেনি। এই প্রক্রিয়াটি সম্পূর্ণভাবে মুছে ফেলার জন্য প্যারেন্টকে তার চাইল্ডের এক্সিট স্ট্যাটাস পড়তে হয়, যাকে বলা হয় reaping। একবার স্ট্যাটাস পড়ে নিলে, প্রক্রিয়াটি পুরোপুরি মুছে যায়।
ভুল বিকল্পগুলোর ব্যাখ্যা:
-
খ) Process waiting for I/O: এটি কেবল একটি blocked বা waiting state–এ থাকা প্রক্রিয়া, zombie নয়।
-
গ) Process stuck in deadlock: এখানে প্রক্রিয়াটি অন্য একটি রিসোর্সের জন্য অনির্দিষ্টকাল অপেক্ষা করছে, যা zombie অবস্থা নয়।
-
ঘ) Process in an infinite loop: এটি একটি running process, যা CPU ব্যবহার করছে কিন্তু এখনো শেষ হয়নি; তাই এটি zombie নয়।
উ. ক) a process whose parent has not acknowledged its exit status
ব্যাখ্যা: Zombie process তখনই তৈরি হয়, যখন কোনো প্রক্রিয়া শেষ হয়ে গেলেও তার প্যারেন্ট wait() করে এক্সিট স্ট্যাটাস পড়ে না, ফলে প্রক্রিয়ার তথ্য Process Table–এ থেকে যায়।

0
Updated: 13 hours ago