කිරියෙන් පැනියෙන් ඉතිරෙන සුභම සුභ අලුත් අවුරුද්දක් වේවා....

2012-07-07

ඉංග්‍රීසි වචන සාමාන්‍යකරණයට(Normalization) Porter Stemming ඇල්ගොරිතමය(Algorithm) - මෘදුකාංග නිර්මාපකයන් සඳහා(For Software Developers)


මෙම ලිපියෙන් මම ලියන්න බලපොරොත්තු වෙන්නෙ මෘදුකාංග ශිල්පීන්ට(Software Engineers) ඉතාමත් වැදගත් වන එක් සුවිශේෂී ඇල්ගොරිතමයක්(algorithm) ගැන. මෙහි නම පෝටර් ස්ටෙමින් ඇල්ගොරිතමය(Porter Stemming Algorithm). මෙහි නිර්මාපකයා වන්නේ මර්ටින් පෝටර්(Martin Porter). මේකෙන් කෙරෙන්නෙ සාමාන්‍ය ඉංග්‍රීසි වචන වල අග කොටස් ඉවත් කිරීමේ ක්‍රියාවලියක්. උදාහරණයක් විදියට ගත්තොත් meeting කියන වචනය meet බවට පත් කරන්ව. ඒ වගේ tion, ies, s, වැනි අග කොටස් වචන වලින් ඉවත් කරන්ව. මේ ඉවත් කිරීම වචන සෙවීමේ මෘදුකාංග(word searching software) නිපදවීමට ඉතාමත් ප්‍රයෝජනවත් වෙන්වා. ඒ වගේම පරිවර්තක වැඩසටහන්(Translator software) වලට හා කෘතිම බුද්ධිය පිළිබඳ වැඩසටහන්(AI applications) වලට  ඉතාමත් කාර්යක්ෂම විදියට යොදාගන්න පුලුවන්.
ඉතින් මේ අල්ගොරිතමය(algorithm) පරිගනක ක්‍රමලේඛන භාෂා(programming languages) රැසකින් නොමිලේම ලබාගැනීමේ හැකියාවක් තිබෙනවා. මෙම අල්ගොරිත්මය(algorithm) පිලිබඳ තවත් තොරතුරු දැනගැනීමට හෝ එම අල්ගොරිතමය(algorithm) ලබාගැනීමට පහත තියෙන වෙබ් අඩවියට පිවිසෙන්න.

http://tartarus.org/~martin/PorterStemmer/


ඒවගේම මෙම දැනුම තවත් කෙනෙකුට ලබාගැනීමට මෙම ලිපිය බෙදාහරින්න.

2 comments:

  1. Thnaks mchn, මම මෙකට Algorithm එකක් Plan කර කර තමා හිටියෙ. දැන් ඒක ලියන්න ඕනවෙන්නෙ නෑ. Blog එක දිගටම update කරපන්. Weldone.

    ReplyDelete

Let me know your ideas or doubts...