පුවත්

October 27, 2023

විප්ලවීය පරිගණක දැක්ම: LLaVA සහ සියුම් සුසර කිරීමේ බලය

Priyanka Fernando
WriterPriyanka FernandoWriter
ResearcherAishwarya NairResearcher

මම මෑතකදී පරිගණක දෘෂ්ඨි ලෝකය තුළට ගොස් LLaVA නම් දර්ශනීය භාෂා ආකෘතියක් සොයා ගත්තෙමි. මෙම ආකෘතිය රූපයක නිශ්චිත ලක්ෂණ හඳුනා ගැනීමට ආකෘතියක් ඉගැන්වීමේ ක්රියාවලිය විප්ලවීය වෙනසක් සිදු කර ඇත.

විප්ලවීය පරිගණක දැක්ම: LLaVA සහ සියුම් සුසර කිරීමේ බලය

සාම්ප්‍රදායිකව, රූපයක මෝටර් රථයක වර්ණය හඳුනා ගැනීමට ආකෘතියක් පුහුණු කිරීම සඳහා මුල සිටම පුහුණු කිරීමේ වෙහෙසකාරී ක්‍රියාවලියක් අවශ්‍ය විය. කෙසේ වෙතත්, LLaVA වැනි මාදිලි සමඟ, ඔබ කළ යුත්තේ "මෝටර් රථයේ වර්ණය කුමක්ද?" වැනි ප්‍රශ්නයක් සමඟ එය විමසීමයි. සහ voila! ඔබට ඔබේ පිළිතුර ලැබේ, ශුන්‍ය-වෙඩි විලාසය.

මෙම ප්‍රවේශය ස්වභාවික භාෂා සැකසුම් ක්‍ෂේත්‍රයේ (NLP) අප දැක ඇති දියුණුව පිළිබිඹු කරයි. මුල සිටම භාෂා ආකෘති පුහුණු කරනවා වෙනුවට, පර්යේෂකයන් දැන් ඔවුන්ගේ නිශ්චිත අවශ්‍යතාවලට සරිලන පරිදි පෙර පුහුණු කළ ආකෘති මනාව සකස් කරති. ඒ හා සමානව, පරිගණක දර්ශනය එකම දිශාවකට ගමන් කරයි.

සරල පෙළ ප්‍රේරකයකින් පින්තූර වලින් වටිනා තීක්ෂ්ණ බුද්ධිය උකහා ගැනීමට හැකි වීම ගැන සිතන්න. ඔබට ආකෘතියේ කාර්ය සාධනය වැඩි දියුණු කිරීමට අවශ්‍ය නම්, සියුම් සුසර කිරීම ආශ්චර්යමත් කළ හැකිය. ඇත්ත වශයෙන්ම, මගේ අත්හදා බැලීම්වලින් පෙන්නුම් කර ඇත්තේ සියුම්ව සකස් කරන ලද ආකෘති මුල සිටම පුහුණු වූ අය අභිබවා යා හැකි බවයි. ඒක හරියට ලෝක දෙකේම හොඳම දේ තියෙනවා වගේ!

නමුත් සැබෑ ක්‍රීඩාව වෙනස් කරන්නා මෙන්න: පදනම් ආකෘති, දැවැන්ත දත්ත කට්ටල පිළිබඳ ඔවුන්ගේ පුළුල් පුහුණුවට ස්තූතිවන්ත වන අතර, රූප නිරූපණයන් පිළිබඳ විශිෂ්ට අවබෝධයක් ඇත. මෙයින් අදහස් කරන්නේ ඔබට පින්තූර දහස් ගණනක් එකතු කිරීමේ අවශ්‍යතාවය ඉවත් කරමින් උදාහරණ කිහිපයක් සමඟ ඒවා මනාව සකස් කළ හැකි බවයි. ඇත්ත වශයෙන්ම, ඔවුන්ට එක් උදාහරණයකින් පවා ඉගෙන ගත හැකිය.

සංවර්ධන වේගය රූප සමඟ අන්තර් ක්‍රියා කිරීමට පෙළ විමසුම් භාවිතා කිරීමේ තවත් වාසියකි. මෙම ප්රවේශය සමඟ, ඔබට තත්පර කිහිපයකින් පරිගණක දර්ශන මූලාකෘතියක් ඉක්මනින් නිර්මාණය කළ හැකිය. එය වේගවත්, කාර්යක්ෂම වන අතර එය ක්ෂේත්‍රයේ විප්ලවීය වෙනසක් ඇති කරයි.

ඉතින්, අපි පරිගණක දැක්මේ මූලිකාංග මුල් තැන ගන්නා අනාගතයක් කරා ගමන් කරනවාද, නැතිනම් මුල සිටම ආකෘති පුහුණු කිරීමට තවමත් තැනක් තිබේද? මෙම ප්රශ්නයට පිළිතුර පරිගණක දර්ශනයේ අනාගතය හැඩගස්වනු ඇත.

PS මම Datasaurus නම් මගේ විවෘත මූලාශ්‍ර වේදිකාව නිර්ලජ්ජිත ලෙස සම්බන්ධ කිරීමට කැමතියි. ඉන්ජිනේරුවන්ට රූපවලින් ඉක්මනින් තීක්ෂ්ණ බුද්ධිය ලබා ගැනීමට උපකාර කිරීම සඳහා එය දර්ශන-භාෂා ආකෘතිවල බලය යොදා ගනී. මට අවශ්‍ය වූයේ මගේ අදහස් බෙදාගෙන පරිගණක දැක්මේ අනාගතය ගැන සංවාදයක් ආරම්භ කිරීමටයි. අපි කතා කරමු!

About the author
Priyanka Fernando
Priyanka Fernando
About

ප්‍රියංකා ප්‍රනාන්දු, ශ්‍රී ලංකාවේ හුන් හෝදුන් 33 වයසේ යුවතියෙකි. ඔයාගේ ජාල කැසිනෝ සඳහා සිංහල පැදවීම් කුෂලතාව සමග ඔයාගේ ප්‍රේමය එකට ගත්තා ආකාරයට, ශ්‍රී ලංකානු අාදානයන් සඳහා අතුරු රඳවාගැනීමේ කිහිපයක් සෑදෙයි.

Send email
More posts by Priyanka Fernando
undefined is not available in your country. Please try:

නවතම ප්‍රවෘත්ති

සිහින දසකයක්: වසර 30ක් සඳහා මාසිකව පවුම් 10,000ක් දිනාගැනීම ජීවිතය වෙනස් කරන්නේ කෙසේද?
2024-05-07

සිහින දසකයක්: වසර 30ක් සඳහා මාසිකව පවුම් 10,000ක් දිනාගැනීම ජීවිතය වෙනස් කරන්නේ කෙසේද?

පුවත්