நிகண்டியம் திட்டம்

நிகண்டியம் திட்டம்

இணையத்தில் தமிழார்வம் கொண்ட தன்னார்வலர்கள் பலர் சேர்ந்து தமிழ் அகராதிகளைத் தொகுத்து மின்னுருவாக்கம் செய்யும் நிகண்டியம் என்ற ஒரு திட்டம் தொடங்கப்பட்டுள்ளது. அதன் பொருட்டு, பொதுவகத்திலுள்ள தமிழ் அகராதிகளை மெய்ப்புப் பார்த்து, மின்னூலாக்கம் செய்ய முதற்திட்டமாக முடிவுசெய்யப்பட்டுள்ளது. வள்ளுவர் வள்ளலார் வட்டம் நிகண்டியம் பணியை கையில் எடுக்கும் முன் தமிழ் விக்சனரியில் இருக்கும் தமிழின் சொற்களின் எண்ணிக்கை 3,49,474. அயல்மொழி விக்சனரிகளின் சொற்களின் எண்ணிக்கையில் ஒப்பீட்டுப் பட்டியலில் தமிழ் 19 ஆவது இடம். ஆங்கிலம், மலகாஸி, பிரஞ்சு, ரஷியன், செர்போ – குரோசியம், ஸ்பானிஷ், சீன, ஜெர்மன், குர்திஷ், டச்சு, ஸ்வீடிஷ், போலிஷ், லிதுவேனியன், கிரேக்கம், இத்தாலிய, காடலான், பின்னிஷ், ஹங்கேரியன் மொழிகள் சொற்களின் எண்ணிக்கை நமக்கு முன் இருக்கிறது.

முன்னுரை

ஆங்கில சொற்களுக்கு தமிழ் சொற்களை பலர் உருவாக்கிக் கொண்டிருக்கிறார்கள், நூலாக வெளியிட்டு உள்ளார்கள், புத்தகமாக வெளியிட்டாலோ அல்லது இணையத்தில் அகராதியாக வெளியிட்டாலோ கணினி அதனை கற்றுக் கொள்ளாது. அதை (ARTIFICIAL INTELLIGENCE) செயற்கை நுண்ணறிவுக்கு கற்றுத்தர வேண்டுமென்ற முனைப்பில் கணினிக்கு கற்பிப்போம் தமிழை என்ற முழக்கத்தை முன்வைத்து இந்தத் திட்டத்தைத் தொடங்கி 10 லட்சம் சொற்கள் வரை தொகுத்துவிட்டோம். முதல்கட்டமாக படைப்பாக்கப் பொதும உரிமையின்கீழ் அறிவிக்கப்பட்டிருக்கும் (சிறிய அளவில் காப்புரிமை உள்ள) அகராதிகளை தேடுபொறி வசதியுடன் மின்னாக்கம் செய்து அதனை பொதும உரிமையின்கீழ் அறிவித்து அனைத்துத் தமிழர்களுக்கும் பொதுவுடமையாக்குதல். அடுத்த திட்டமாகக் கணினி நுண்ணறிவைப் பயன்படுத்தும் விக்கி, கூகுள், மைக்ரோசாஃப்ட் போன்ற அனைத்து நிறுவனங்களுக்கும் தமிழைக் கொண்டு சேர்க்கத் திட்டமிட்டுள்ளோம்.

நிகண்டியம் திட்டத்தின் படிநிலைகள்

  1. அகராதிகளை PDF வடிவில் மாற்றுவது SCANNING
  2. PDF அகராதிகளை TA.WIKISOURCE.ORG யில் இணைப்பது
  3. இணைக்கப்பட்ட PDF படங்களுக்கு எழுத்துணரியாக்கம் OCR செய்தல்
  4. அதன்பிறகு மெய்ப்புப்பணி பார்ப்பது EDITTING
  5. மெய்ப்பு பணி முடிந்தவற்றை எழுத்துப்பிழைகள் பார்ப்பது PROOFING
  6. அனைத்து முடிந்தவுடன் அதனை EXCEL வடிவில் கொண்டு வருவது
  7. பிறகு EXCEL ஆவணத்தை விக்கி TA.WIKTIONARY.ORG யில் இணைப்பது UPLOADING

நிகண்டியத் திட்டத்திற்கு உங்கள் கணினி அறிவைப் பயன்படுத்திப் பங்களிக்கலாம் PROGRAMMING (விக்கி API உடன் எப்படி பயன்படுத்தலாம் என நாங்கள் கற்றுத்தருகிறோம். PYTHON, PHP, C# என எந்த SERVER SIDE SCRIPTING தெரிந்தாலும் போதும்). உங்களால் இதில் நீங்கள் எதில் பங்காற்ற முடியுமோ அதில் பங்காற்றி உதவுங்கள் நன்றி

அகராதி வகைகள்

  1. நிகண்டு (POETIC PRE DICTIONARY)
  2. அகரமுதலி / அகராதி (DICTIONARY)
  3. அகரவரிசை (VOCABULARY)
  4. சொற்பொருளி (LEXICON)
  5. கலைக்களஞ்சியம் (ENCYCLOPAEDIA)
  6. சொற்களஞ்சியம் (THESAURUS)
  7. சொற்கோவை (CONCORDANCE)
  8. சொற்பட்டி (INDEX)
  9. சொல்லடைவு (GLOSSORY)
  10. திணைக்களஞ்சியம் (GAZETTEER)

 

தொடர்பிற்கு

இத்திட்டம் தொடர்பாகக் கூடுதல் தகவலுக்கும் குழுவில் இணைவதற்கும் VALLUVAR.VALLALAR.VATTAM@GMAIL.COM முகவரியில் தொடர்பு கொள்ளலாம்.

செய்திகள்

நன்கொடை அளிக்க

ACCOUNT NAME – INGERSOL SELVARAJ

ACCOUNT NUMBER – 602701518901

BANK – ICICI BANK LTD

BRANCH – MAYILADUTHURAI MAHADHANA ATRT

IFSC CODE – ICIC0001912

CITY – MAYURAM (MAYILADUTHURAI)

DISTRICT – NAGAPATTINAM

STATE – TAMIL NADU

MICR CODE – 609229005

BRANCH CODE – 001912

ADDRESS – ICICI BANK LTD, RMS ARCADE, NEW NO. 54, MAHADHANA STREET, MAYILADUTHURAI 609001, TAMIL NADU