In NLP, which one is used to convert words into numerical vectors that capture semantic meaning?

A

Tokenization.

B

Word embeddings.

C

Stemming.

D

POS tagging.

উত্তরের বিবরণ

img

Word embeddings হলো NLP-তে ব্যবহৃত এমন একটি কৌশল, যা শব্দগুলোকে সংখ্যাগত ভেক্টরে (numerical vectors) রূপান্তর করে, যেখানে প্রতিটি ভেক্টর শব্দের অর্থগত (semantic) অর্থ ধারণ করে।

বিস্তারিতভাবে—

  • Word embeddings (সঠিক উত্তর): এটি শব্দের একটি dense, low-dimensional vector representation, যেমন Word2Vec, GloVe, বা FastText। এই ভেক্টরগুলো এমনভাবে গঠিত যে, অর্থে মিল থাকা শব্দগুলোর ভেক্টরগুলো ভেক্টর স্পেসে কাছাকাছি অবস্থান করে। এর ফলে মেশিন লার্নিং মডেলগুলো শব্দের অর্থ, প্রেক্ষাপট, ও পারস্পরিক সম্পর্ক বুঝতে সক্ষম হয়।

অন্য বিকল্পগুলোর ব্যাখ্যা:

  • Tokenization (ক): এটি টেক্সটকে ছোট ছোট ইউনিট বা টোকেনে ভাগ করার প্রক্রিয়া, সাধারণত শব্দ বা উপশব্দে। এটি এমবেডিংয়ের আগে প্রাথমিক ধাপ হিসেবে ব্যবহৃত হয়।

  • Stemming (গ): এটি শব্দকে তার মূল রূপে বা stem-এ নামিয়ে আনে (যেমন “running” → “run”)। এর লক্ষ্য হলো শব্দের বিভিন্ন রূপকে একত্র করা, কিন্তু এটি শব্দের প্রকৃত অর্থ সংরক্ষণ করে না।

  • POS Tagging (ঘ): এটি Part-of-Speech Tagging, অর্থাৎ প্রতিটি শব্দকে তার বাক্যে ভূমিকার (noun, verb, adjective ইত্যাদি) সঙ্গে চিহ্নিত করা। এটি মূলত syntactic অর্থ বোঝায়, semantic নয়।

Unfavorite

0

Updated: 15 hours ago

Related MCQ

এনক্রিপ্ট করার পর যে ডেটা পাওয়া যায়, তাকে কী বলা হয়?

Created: 1 month ago

A

Plain text

B

Cipher text


C

Cryptography


D

Decrypted text

Unfavorite

0

Updated: 1 month ago

ডেটা এনক্রিপশন প্রক্রিয়ায় ডেটাকে পাঠ-অযোগ্য রূপে রূপান্তরিত করতে কোন উপাদানটি ব্যবহৃত হয়?


Created: 1 month ago

A

ডিপ্লেইনটেক্সট


B

ফায়ারওয়াল


C

এনক্রিপশন অ্যালগরিদম


D

প্লেইনটেক্সট


Unfavorite

0

Updated: 1 month ago

Which one corresponds to binding data and code together?

Created: 1 day ago

A

Polymorphism 


B

Abstraction

C

Encapsulation

D

Inheritance

Unfavorite

0

Updated: 1 day ago

© LXMCQ, Inc. - All Rights Reserved

Developed by WiztecBD