Update render script and Makefile
This commit is contained in:
216
terminal/nlp
216
terminal/nlp
@@ -1,4 +1,4 @@
|
||||
[38;5;12m [39m[38;2;255;187;0m[1m[4mawesome-nlp[0m
|
||||
[38;5;12m [39m[38;2;255;187;0m[1m[4mawesome-nlp[0m
|
||||
|
||||
[38;5;14m[1m![0m[38;5;12mAwesome[39m[38;5;14m[1m (https://cdn.rawgit.com/sindresorhus/awesome/d7305f38d29fed78fa85652e3a63e154dd8e8829/media/badge.svg)[0m[38;5;12m (https://github.com/sindresorhus/awesome)[39m
|
||||
|
||||
@@ -8,7 +8,8 @@
|
||||
|
||||
[38;5;12mRead this in [39m[38;5;14m[1mEnglish[0m[38;5;12m (./README.md), [39m[38;5;14m[1mTraditional Chinese[0m[38;5;12m (./README-ZH-TW.md)[39m
|
||||
|
||||
[38;5;12m_Please read the [39m[38;5;14m[1mcontribution guidelines[0m[38;5;12m (contributing.md) before contributing. Please add your favourite NLP resource by raising a [39m[38;5;14m[1mpull request[0m[38;5;12m (https://github.com/keonkim/awesome-nlp/pulls)_[39m
|
||||
[38;5;12m_Please[39m[38;5;12m [39m[38;5;12mread[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mcontribution[0m[38;5;14m[1m [0m[38;5;14m[1mguidelines[0m[38;5;12m [39m[38;5;12m(contributing.md)[39m[38;5;12m [39m[38;5;12mbefore[39m[38;5;12m [39m[38;5;12mcontributing.[39m[38;5;12m [39m[38;5;12mPlease[39m[38;5;12m [39m[38;5;12madd[39m[38;5;12m [39m[38;5;12myour[39m[38;5;12m [39m[38;5;12mfavourite[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mresource[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;12mraising[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;14m[1mpull[0m[38;5;14m[1m [0m[38;5;14m[1mrequest[0m[38;5;12m [39m
|
||||
[38;5;12m(https://github.com/keonkim/awesome-nlp/pulls)_[39m
|
||||
|
||||
[38;2;255;187;0m[4mContents[0m
|
||||
|
||||
@@ -56,8 +57,8 @@
|
||||
|
||||
[38;2;255;187;0m[4mResearch Summaries and Trends[0m
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mNLP-Overview[0m[38;5;12m [39m[38;5;12m(https://nlpoverview.com/)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mup-to-date[39m[38;5;12m [39m[38;5;12moverview[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mdeep[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mtechniques[39m[38;5;12m [39m[38;5;12mapplied[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mNLP,[39m[38;5;12m [39m[38;5;12mincluding[39m[38;5;12m [39m[38;5;12mtheory,[39m[38;5;12m [39m[38;5;12mimplementations,[39m[38;5;12m [39m[38;5;12mapplications,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mstate-of-the-art[39m[38;5;12m [39m[38;5;12mresults.[39m[38;5;12m [39m[38;5;12mThis[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mgreat[39m[38;5;12m [39m[38;5;12mDeep[39m
|
||||
[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mIntroduction[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mresearchers.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mNLP-Overview[0m[38;5;12m [39m[38;5;12m(https://nlpoverview.com/)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mup-to-date[39m[38;5;12m [39m[38;5;12moverview[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mdeep[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mtechniques[39m[38;5;12m [39m[38;5;12mapplied[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mNLP,[39m[38;5;12m [39m[38;5;12mincluding[39m[38;5;12m [39m[38;5;12mtheory,[39m[38;5;12m [39m[38;5;12mimplementations,[39m[38;5;12m [39m[38;5;12mapplications,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mstate-of-the-art[39m[38;5;12m [39m[38;5;12mresults.[39m[38;5;12m [39m
|
||||
[38;5;12mThis[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mgreat[39m[38;5;12m [39m[38;5;12mDeep[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mIntroduction[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mresearchers.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mNLP-Progress[0m[38;5;12m (https://nlpprogress.com/) tracks the progress in Natural Language Processing, including the datasets and the current state-of-the-art for the most common NLP tasks[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mNLP's ImageNet moment has arrived[0m[38;5;12m (https://thegradient.pub/nlp-imagenet/)[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mACL 2018 Highlights: Understanding Representation and Evaluation in More Challenging Settings[0m[38;5;12m (http://ruder.io/acl-2018-highlights/)[39m
|
||||
@@ -73,15 +74,16 @@
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mThe[0m[38;5;14m[1m [0m[38;5;14m[1mBerkeley[0m[38;5;14m[1m [0m[38;5;14m[1mNLP[0m[38;5;14m[1m [0m[38;5;14m[1mGroup[0m[38;5;12m [39m[38;5;12m(http://nlp.cs.berkeley.edu/index.shtml)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNotable[39m[38;5;12m [39m[38;5;12mcontributions[39m[38;5;12m [39m[38;5;12minclude[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mtool[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mreconstruct[39m[38;5;12m [39m[38;5;12mlong[39m[38;5;12m [39m[38;5;12mdead[39m[38;5;12m [39m[38;5;12mlanguages,[39m[38;5;12m [39m[38;5;12mreferenced[39m[38;5;12m [39m[38;5;14m[1mhere[0m[38;5;12m [39m
|
||||
[38;5;12m(https://www.bbc.com/news/science-environment-21427896)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;12mtaking[39m[38;5;12m [39m[38;5;12mcorpora[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12m637[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12mcurrently[39m[38;5;12m [39m[38;5;12mspoken[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mAsia[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mPacific[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mrecreating[39m[38;5;12m [39m[38;5;12mtheir[39m[38;5;12m [39m[38;5;12mdescendant.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mTechnologies[0m[38;5;14m[1m [0m[38;5;14m[1mInstitute,[0m[38;5;14m[1m [0m[38;5;14m[1mCarnegie[0m[38;5;14m[1m [0m[38;5;14m[1mMellon[0m[38;5;14m[1m [0m[38;5;14m[1mUniversity[0m[38;5;12m [39m[38;5;12m(http://www.cs.cmu.edu/~nasmith/nlp-cl.html)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNotable[39m[38;5;12m [39m[38;5;12mprojects[39m[38;5;12m [39m[38;5;12minclude[39m[38;5;12m [39m[38;5;14m[1mAvenue[0m[38;5;14m[1m [0m[38;5;14m[1mProject[0m[38;5;12m [39m[38;5;12m(http://www.cs.cmu.edu/~avenue/),[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12msyntax[39m[38;5;12m [39m[38;5;12mdriven[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m
|
||||
[38;5;12mtranslation[39m[38;5;12m [39m[38;5;12msystem[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mendangered[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12mlike[39m[38;5;12m [39m[38;5;12mQuechua[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mAymara[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mpreviously,[39m[38;5;12m [39m[38;5;14m[1mNoah's[0m[38;5;14m[1m [0m[38;5;14m[1mArk[0m[38;5;12m [39m[38;5;12m(http://www.cs.cmu.edu/~ark/)[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12mcreated[39m[38;5;12m [39m[38;5;14m[1mAQMAR[0m[38;5;12m [39m[38;5;12m(http://www.cs.cmu.edu/~ark/AQMAR/)[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mimprove[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mtools[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m
|
||||
[38;5;12mArabic.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mNLP research group, Columbia University[0m
|
||||
[38;5;12m (http://www1.cs.columbia.edu/nlp/index.cgi) - Responsible for creating BOLT ( interactive error handling for speech translation systems) and an un-named project to characterize laughter in dialogue.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mThe[0m[38;5;14m[1m [0m[38;5;14m[1mCenter[0m[38;5;14m[1m [0m[38;5;14m[1mor[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mand[0m[38;5;14m[1m [0m[38;5;14m[1mSpeech[0m[38;5;14m[1m [0m[38;5;14m[1mProcessing,[0m[38;5;14m[1m [0m[38;5;14m[1mJohn[0m[38;5;14m[1m [0m[38;5;14m[1mHopkins[0m[38;5;14m[1m [0m[38;5;14m[1mUniversity[0m[38;5;12m [39m[38;5;12m(http://clsp.jhu.edu/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mRecently[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mnews[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mdeveloping[39m[38;5;12m [39m[38;5;12mspeech[39m[38;5;12m [39m[38;5;12mrecognition[39m[38;5;12m [39m[38;5;12msoftware[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mcreate[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mdiagnostic[39m[38;5;12m [39m[38;5;12mtest[39m[38;5;12m [39m[38;5;12mor[39m[38;5;12m [39m[38;5;12mParkinson's[39m[38;5;12m [39m
|
||||
[38;5;12mDisease,[39m[38;5;12m [39m[38;5;14m[1mhere[0m[38;5;12m [39m[38;5;12m(https://www.clsp.jhu.edu/2019/03/27/speech-recognition-software-and-machine-learning-tools-are-being-used-to-create-diagnostic-test-for-parkinsons-disease/#.XNFqrIkzYdU).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mComputational[0m[38;5;14m[1m [0m[38;5;14m[1mLinguistics[0m[38;5;14m[1m [0m[38;5;14m[1mand[0m[38;5;14m[1m [0m[38;5;14m[1mInformation[0m[38;5;14m[1m [0m[38;5;14m[1mProcessing[0m[38;5;14m[1m [0m[38;5;14m[1mGroup,[0m[38;5;14m[1m [0m[38;5;14m[1mUniversity[0m[38;5;14m[1m [0m[38;5;14m[1mof[0m[38;5;14m[1m [0m[38;5;14m[1mMaryland[0m[38;5;12m [39m[38;5;12m(https://wiki.umiacs.umd.edu/clip/index.php/Main_Page)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNotable[39m[38;5;12m [39m[38;5;12mcontributions[39m[38;5;12m [39m[38;5;12minclude[39m[38;5;12m [39m[38;5;14m[1mHuman-Computer[0m[38;5;14m[1m [0m[38;5;14m[1mCooperation[0m[38;5;14m[1m [0m[38;5;14m[1mor[0m[38;5;14m[1m [0m
|
||||
[38;5;14m[1mWord-by-Word[0m[38;5;14m[1m [0m[38;5;14m[1mQuestion[0m[38;5;14m[1m [0m[38;5;14m[1mAnswering[0m[38;5;12m [39m[38;5;12m(http://www.umiacs.umd.edu/~jbg/projects/IIS-1652666)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mmodeling[39m[38;5;12m [39m[38;5;12mdevelopment[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mphonetic[39m[38;5;12m [39m[38;5;12mrepresentations.[39m[38;5;12m [39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mTechnologies[0m[38;5;14m[1m [0m[38;5;14m[1mInstitute,[0m[38;5;14m[1m [0m[38;5;14m[1mCarnegie[0m[38;5;14m[1m [0m[38;5;14m[1mMellon[0m[38;5;14m[1m [0m[38;5;14m[1mUniversity[0m[38;5;12m [39m[38;5;12m(http://www.cs.cmu.edu/~nasmith/nlp-cl.html)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNotable[39m[38;5;12m [39m[38;5;12mprojects[39m[38;5;12m [39m[38;5;12minclude[39m[38;5;12m [39m[38;5;14m[1mAvenue[0m[38;5;14m[1m [0m[38;5;14m[1mProject[0m[38;5;12m [39m[38;5;12m(http://www.cs.cmu.edu/~avenue/),[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12msyntax[39m
|
||||
[38;5;12mdriven[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m[38;5;12mtranslation[39m[38;5;12m [39m[38;5;12msystem[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mendangered[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12mlike[39m[38;5;12m [39m[38;5;12mQuechua[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mAymara[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mpreviously,[39m[38;5;12m [39m[38;5;14m[1mNoah's[0m[38;5;14m[1m [0m[38;5;14m[1mArk[0m[38;5;12m [39m[38;5;12m(http://www.cs.cmu.edu/~ark/)[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12mcreated[39m[38;5;12m [39m[38;5;14m[1mAQMAR[0m[38;5;12m [39m
|
||||
[38;5;12m(http://www.cs.cmu.edu/~ark/AQMAR/)[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mimprove[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mtools[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mArabic.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mNLP[0m[38;5;14m[1m [0m[38;5;14m[1mresearch[0m[38;5;14m[1m [0m[38;5;14m[1mgroup,[0m[38;5;14m[1m [0m[38;5;14m[1mColumbia[0m[38;5;14m[1m [0m[38;5;14m[1mUniversity[0m[38;5;12m [39m[38;5;12m(http://www1.cs.columbia.edu/nlp/index.cgi)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mResponsible[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mcreating[39m[38;5;12m [39m[38;5;12mBOLT[39m[38;5;12m [39m[38;5;12m([39m[38;5;12m [39m[38;5;12minteractive[39m[38;5;12m [39m[38;5;12merror[39m[38;5;12m [39m[38;5;12mhandling[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mspeech[39m[38;5;12m [39m[38;5;12mtranslation[39m[38;5;12m [39m[38;5;12msystems)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m
|
||||
[38;5;12mun-named[39m[38;5;12m [39m[38;5;12mproject[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mcharacterize[39m[38;5;12m [39m[38;5;12mlaughter[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mdialogue.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mThe[0m[38;5;14m[1m [0m[38;5;14m[1mCenter[0m[38;5;14m[1m [0m[38;5;14m[1mor[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mand[0m[38;5;14m[1m [0m[38;5;14m[1mSpeech[0m[38;5;14m[1m [0m[38;5;14m[1mProcessing,[0m[38;5;14m[1m [0m[38;5;14m[1mJohn[0m[38;5;14m[1m [0m[38;5;14m[1mHopkins[0m[38;5;14m[1m [0m[38;5;14m[1mUniversity[0m[38;5;12m [39m[38;5;12m(http://clsp.jhu.edu/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mRecently[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mnews[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mdeveloping[39m[38;5;12m [39m[38;5;12mspeech[39m[38;5;12m [39m[38;5;12mrecognition[39m[38;5;12m [39m[38;5;12msoftware[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mcreate[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mdiagnostic[39m[38;5;12m [39m[38;5;12mtest[39m[38;5;12m [39m[38;5;12mor[39m
|
||||
[38;5;12mParkinson's[39m[38;5;12m [39m[38;5;12mDisease,[39m[38;5;12m [39m[38;5;14m[1mhere[0m[38;5;12m [39m
|
||||
[38;5;12m(https://www.clsp.jhu.edu/2019/03/27/speech-recognition-software-and-machine-learning-tools-are-being-used-to-create-diagnostic-test-for-parkinsons-disease/#.XNFqrIkzYdU).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mComputational[0m[38;5;14m[1m [0m[38;5;14m[1mLinguistics[0m[38;5;14m[1m [0m[38;5;14m[1mand[0m[38;5;14m[1m [0m[38;5;14m[1mInformation[0m[38;5;14m[1m [0m[38;5;14m[1mProcessing[0m[38;5;14m[1m [0m[38;5;14m[1mGroup,[0m[38;5;14m[1m [0m[38;5;14m[1mUniversity[0m[38;5;14m[1m [0m[38;5;14m[1mof[0m[38;5;14m[1m [0m[38;5;14m[1mMaryland[0m[38;5;12m [39m[38;5;12m(https://wiki.umiacs.umd.edu/clip/index.php/Main_Page)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNotable[39m[38;5;12m [39m[38;5;12mcontributions[39m[38;5;12m [39m[38;5;12minclude[39m[38;5;12m [39m[38;5;14m[1mHuman-Computer[0m[38;5;14m[1m [0m
|
||||
[38;5;14m[1mCooperation[0m[38;5;14m[1m [0m[38;5;14m[1mor[0m[38;5;14m[1m [0m[38;5;14m[1mWord-by-Word[0m[38;5;14m[1m [0m[38;5;14m[1mQuestion[0m[38;5;14m[1m [0m[38;5;14m[1mAnswering[0m[38;5;12m [39m[38;5;12m(http://www.umiacs.umd.edu/~jbg/projects/IIS-1652666)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mmodeling[39m[38;5;12m [39m[38;5;12mdevelopment[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mphonetic[39m[38;5;12m [39m[38;5;12mrepresentations.[39m[38;5;12m [39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mPenn Natural Language Processing, University of Pennsylvania[0m[38;5;12m (https://nlp.cis.upenn.edu/)- Famous for creating the [39m[38;5;14m[1mPenn Treebank[0m[38;5;12m (https://www.seas.upenn.edu/~pdtb/).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mThe[0m[38;5;14m[1m [0m[38;5;14m[1mStanford[0m[38;5;14m[1m [0m[38;5;14m[1mNautral[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mProcessing[0m[38;5;14m[1m [0m[38;5;14m[1mGroup[0m[38;5;12m [39m[38;5;12m(https://nlp.stanford.edu/)-[39m[38;5;12m [39m[38;5;12mOne[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mtop[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mresearch[39m[38;5;12m [39m[38;5;12mlabs[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mworld,[39m[38;5;12m [39m[38;5;12mnotable[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mcreating[39m[38;5;12m [39m[38;5;14m[1mStanford[0m[38;5;14m[1m [0m[38;5;14m[1mCoreNLP[0m[38;5;12m [39m
|
||||
[38;5;12m(https://nlp.stanford.edu/software/corenlp.shtml)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mtheir[39m[38;5;12m [39m[38;5;14m[1mcoreference[0m[38;5;14m[1m [0m[38;5;14m[1mresolution[0m[38;5;14m[1m [0m[38;5;14m[1msystem[0m[38;5;12m [39m[38;5;12m(https://nlp.stanford.edu/software/dcoref.shtml)[39m
|
||||
@@ -94,8 +96,8 @@
|
||||
|
||||
[38;5;12mGeneral Machine Learning[39m
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mMachine Learning 101[0m
|
||||
[38;5;12m (https://docs.google.com/presentation/d/1kSuQyW5DTnkVaZEjGYCkfOxvzCqGEFzWBy4e9Uedd9k/edit?usp=sharing) from Google's Senior Creative Engineer explains Machine Learning for engineer's and executives alike[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mMachine[0m[38;5;14m[1m [0m[38;5;14m[1mLearning[0m[38;5;14m[1m [0m[38;5;14m[1m101[0m[38;5;12m [39m[38;5;12m(https://docs.google.com/presentation/d/1kSuQyW5DTnkVaZEjGYCkfOxvzCqGEFzWBy4e9Uedd9k/edit?usp=sharing)[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12mGoogle's[39m[38;5;12m [39m[38;5;12mSenior[39m[38;5;12m [39m[38;5;12mCreative[39m[38;5;12m [39m[38;5;12mEngineer[39m[38;5;12m [39m[38;5;12mexplains[39m[38;5;12m [39m[38;5;12mMachine[39m[38;5;12m [39m[38;5;12mLearning[39m[38;5;12m [39m
|
||||
[38;5;12mfor[39m[38;5;12m [39m[38;5;12mengineer's[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mexecutives[39m[38;5;12m [39m[38;5;12malike[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mAI Playbook[0m[38;5;12m (https://aiplaybook.a16z.com/) - a16z AI playbook is a great link to forward to your managers or content for your presentations[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mRuder's Blog[0m[38;5;12m (http://ruder.io/#open) by [39m[38;5;14m[1mSebastian Ruder[0m[38;5;12m (https://twitter.com/seb_ruder) for commentary on the best of NLP Research[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mHow To Label Data[0m[38;5;12m (https://www.lighttag.io/how-to-label-data/) guide to managing larger linguistic annotation projects[39m
|
||||
@@ -116,7 +118,8 @@
|
||||
[38;5;12mBlogs and Newsletters[39m
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mDeep Learning, NLP, and Representations[0m[38;5;12m (https://colah.github.io/posts/2014-07-NLP-RNNs-Representations/)[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mThe Illustrated BERT, ELMo, and co. (How NLP Cracked Transfer Learning)[0m[38;5;12m (https://jalammar.github.io/illustrated-bert/) and [39m[38;5;14m[1mThe Illustrated Transformer[0m[38;5;12m (https://jalammar.github.io/illustrated-transformer/)[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mThe[0m[38;5;14m[1m [0m[38;5;14m[1mIllustrated[0m[38;5;14m[1m [0m[38;5;14m[1mBERT,[0m[38;5;14m[1m [0m[38;5;14m[1mELMo,[0m[38;5;14m[1m [0m[38;5;14m[1mand[0m[38;5;14m[1m [0m[38;5;14m[1mco.[0m[38;5;14m[1m [0m[38;5;14m[1m(How[0m[38;5;14m[1m [0m[38;5;14m[1mNLP[0m[38;5;14m[1m [0m[38;5;14m[1mCracked[0m[38;5;14m[1m [0m[38;5;14m[1mTransfer[0m[38;5;14m[1m [0m[38;5;14m[1mLearning)[0m[38;5;12m [39m[38;5;12m(https://jalammar.github.io/illustrated-bert/)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;14m[1mThe[0m[38;5;14m[1m [0m[38;5;14m[1mIllustrated[0m[38;5;14m[1m [0m[38;5;14m[1mTransformer[0m[38;5;12m [39m
|
||||
[38;5;12m(https://jalammar.github.io/illustrated-transformer/)[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mNatural Language Processing[0m[38;5;12m (https://nlpers.blogspot.com/) by Hal Daumé III[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1marXiv: Natural Language Processing (Almost) from Scratch[0m[38;5;12m (https://arxiv.org/pdf/1103.0398.pdf)[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mKarpathy's The Unreasonable Effectiveness of Recurrent Neural Networks[0m[38;5;12m (https://karpathy.github.io/2015/05/21/rnn-effectiveness)[39m
|
||||
@@ -130,16 +133,16 @@
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mDeep Natural Language Processing[0m[38;5;12m (https://github.com/oxford-cs-deepnlp-2017/lectures) - Lectures series from Oxford[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mDeep Learning for Natural Language Processing (cs224-n)[0m[38;5;12m (https://web.stanford.edu/class/cs224n/) - Richard Socher and Christopher Manning's Stanford Course[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mNeural Networks for NLP[0m[38;5;12m (http://phontron.com/class/nn4nlp2017/) - Carnegie Mellon Language Technology Institute there[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mDeep NLP Course[0m
|
||||
[38;5;12m (https://github.com/yandexdataschool/nlp_course) by Yandex Data School, covering important ideas from text embedding to machine translation including sequence modeling, language models and so on.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mfast.ai[0m[38;5;14m[1m [0m[38;5;14m[1mCode-First[0m[38;5;14m[1m [0m[38;5;14m[1mIntro[0m[38;5;14m[1m [0m[38;5;14m[1mto[0m[38;5;14m[1m [0m[38;5;14m[1mNatural[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mProcessing[0m[38;5;12m [39m[38;5;12m(https://www.fast.ai/2019/07/08/fastai-nlp/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mThis[39m[38;5;12m [39m[38;5;12mcovers[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mblend[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mtraditional[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mtopics[39m[38;5;12m [39m[38;5;12m(including[39m[38;5;12m [39m[38;5;12mregex,[39m[38;5;12m [39m[38;5;12mSVD,[39m[38;5;12m [39m[38;5;12mnaive[39m[38;5;12m [39m[38;5;12mbayes,[39m[38;5;12m [39m[38;5;12mtokenization)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mrecent[39m
|
||||
[38;5;12mneural[39m[38;5;12m [39m[38;5;12mnetwork[39m[38;5;12m [39m[38;5;12mapproaches[39m[38;5;12m [39m[38;5;12m(including[39m[38;5;12m [39m[38;5;12mRNNs,[39m[38;5;12m [39m[38;5;12mseq2seq,[39m[38;5;12m [39m[38;5;12mGRUs,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mTransformer),[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mwell[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12maddressing[39m[38;5;12m [39m[38;5;12murgent[39m[38;5;12m [39m[38;5;12methical[39m[38;5;12m [39m[38;5;12missues,[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mbias[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdisinformation.[39m[38;5;12m [39m[38;5;12mFind[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mJupyter[39m[38;5;12m [39m[38;5;12mNotebooks[39m[38;5;12m [39m[38;5;14m[1mhere[0m[38;5;12m [39m
|
||||
[38;5;12m(https://github.com/fastai/course-nlp)[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mDeep[0m[38;5;14m[1m [0m[38;5;14m[1mNLP[0m[38;5;14m[1m [0m[38;5;14m[1mCourse[0m[38;5;12m [39m[38;5;12m(https://github.com/yandexdataschool/nlp_course)[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;12mYandex[39m[38;5;12m [39m[38;5;12mData[39m[38;5;12m [39m[38;5;12mSchool,[39m[38;5;12m [39m[38;5;12mcovering[39m[38;5;12m [39m[38;5;12mimportant[39m[38;5;12m [39m[38;5;12mideas[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12membedding[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m[38;5;12mtranslation[39m[38;5;12m [39m[38;5;12mincluding[39m[38;5;12m [39m[38;5;12msequence[39m[38;5;12m [39m[38;5;12mmodeling,[39m[38;5;12m [39m
|
||||
[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mmodels[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mso[39m[38;5;12m [39m[38;5;12mon.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mfast.ai[0m[38;5;14m[1m [0m[38;5;14m[1mCode-First[0m[38;5;14m[1m [0m[38;5;14m[1mIntro[0m[38;5;14m[1m [0m[38;5;14m[1mto[0m[38;5;14m[1m [0m[38;5;14m[1mNatural[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mProcessing[0m[38;5;12m [39m[38;5;12m(https://www.fast.ai/2019/07/08/fastai-nlp/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mThis[39m[38;5;12m [39m[38;5;12mcovers[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mblend[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mtraditional[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mtopics[39m[38;5;12m [39m[38;5;12m(including[39m[38;5;12m [39m[38;5;12mregex,[39m[38;5;12m [39m[38;5;12mSVD,[39m[38;5;12m [39m[38;5;12mnaive[39m[38;5;12m [39m[38;5;12mbayes,[39m[38;5;12m [39m
|
||||
[38;5;12mtokenization)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mrecent[39m[38;5;12m [39m[38;5;12mneural[39m[38;5;12m [39m[38;5;12mnetwork[39m[38;5;12m [39m[38;5;12mapproaches[39m[38;5;12m [39m[38;5;12m(including[39m[38;5;12m [39m[38;5;12mRNNs,[39m[38;5;12m [39m[38;5;12mseq2seq,[39m[38;5;12m [39m[38;5;12mGRUs,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mTransformer),[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mwell[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12maddressing[39m[38;5;12m [39m[38;5;12murgent[39m[38;5;12m [39m[38;5;12methical[39m[38;5;12m [39m[38;5;12missues,[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mbias[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdisinformation.[39m[38;5;12m [39m[38;5;12mFind[39m[38;5;12m [39m[38;5;12mthe[39m
|
||||
[38;5;12mJupyter[39m[38;5;12m [39m[38;5;12mNotebooks[39m[38;5;12m [39m[38;5;14m[1mhere[0m[38;5;12m [39m[38;5;12m(https://github.com/fastai/course-nlp)[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mMachine Learning University - Accelerated Natural Language Processing[0m
|
||||
[38;5;12m (https://www.youtube.com/playlist?list=PL8P_Z6C4GcuWfAq8Pt6PBYlck4OprHXsw) - Lectures go from introduction to NLP and text processing to Recurrent Neural Networks and Transformers.[39m
|
||||
[38;5;12mMaterial can be found [39m[38;5;14m[1mhere[0m[38;5;12m (https://github.com/aws-samples/aws-machine-learning-university-accelerated-nlp).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mApplied[0m[38;5;14m[1m [0m[38;5;14m[1mNatural[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mProcessing[0m[38;5;12m [39m[38;5;12m(https://www.youtube.com/playlist?list=PLH-xYrxjfO2WyR3pOAB006CYMhNt4wTqp)-[39m[38;5;12m [39m[38;5;12mLecture[39m[38;5;12m [39m[38;5;12mseries[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12mIIT[39m[38;5;12m [39m[38;5;12mMadras[39m[38;5;12m [39m[38;5;12mtaking[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mbasics[39m[38;5;12m [39m[38;5;12mall[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mway[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mautoencoders[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12meverything.[39m
|
||||
[38;5;12mThe[39m[38;5;12m [39m[38;5;12mgithub[39m[38;5;12m [39m[38;5;12mnotebooks[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mcourse[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12malso[39m[38;5;12m [39m[38;5;12mavailable[39m[38;5;12m [39m[38;5;14m[1mhere[0m[38;5;12m [39m[38;5;12m(https://github.com/Ramaseshanr/anlp)[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mApplied[0m[38;5;14m[1m [0m[38;5;14m[1mNatural[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mProcessing[0m[38;5;12m [39m[38;5;12m(https://www.youtube.com/playlist?list=PLH-xYrxjfO2WyR3pOAB006CYMhNt4wTqp)-[39m[38;5;12m [39m[38;5;12mLecture[39m[38;5;12m [39m[38;5;12mseries[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12mIIT[39m[38;5;12m [39m[38;5;12mMadras[39m[38;5;12m [39m[38;5;12mtaking[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mbasics[39m[38;5;12m [39m[38;5;12mall[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mway[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m
|
||||
[38;5;12mautoencoders[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12meverything.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mgithub[39m[38;5;12m [39m[38;5;12mnotebooks[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mcourse[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12malso[39m[38;5;12m [39m[38;5;12mavailable[39m[38;5;12m [39m[38;5;14m[1mhere[0m[38;5;12m [39m[38;5;12m(https://github.com/Ramaseshanr/anlp)[39m
|
||||
|
||||
|
||||
[38;2;255;187;0m[4mBooks[0m
|
||||
@@ -171,24 +174,25 @@
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;12m | [39m[38;5;14m[1mBack to Top[0m[38;5;12m (#contents)[39m
|
||||
[38;5;12m - [39m[38;5;14m[1msentimental-onix[0m[38;5;12m (https://github.com/sloev/sentimental-onix) Sentiment models for spacy using onnx[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mTextAttack[0m[38;5;12m (https://github.com/QData/TextAttack) - Adversarial attacks, adversarial training, and data augmentation in NLP[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mTextBlob[0m[38;5;12m [39m[38;5;12m(http://textblob.readthedocs.org/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mProviding[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mconsistent[39m[38;5;12m [39m[38;5;12mAPI[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mdiving[39m[38;5;12m [39m[38;5;12minto[39m[38;5;12m [39m[38;5;12mcommon[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mprocessing[39m[38;5;12m [39m[38;5;12m(NLP)[39m[38;5;12m [39m[38;5;12mtasks.[39m[38;5;12m [39m[38;5;12mStands[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mgiant[39m[38;5;12m [39m[38;5;12mshoulders[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;14m[1mNatural[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mToolkit[0m[38;5;14m[1m [0m[38;5;14m[1m(NLTK)[0m[38;5;12m [39m
|
||||
[38;5;12m(https://www.nltk.org/)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;14m[1mPattern[0m[38;5;12m [39m[38;5;12m(https://github.com/clips/pattern),[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mplays[39m[38;5;12m [39m[38;5;12mnicely[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mboth[39m[38;5;12m [39m[38;5;12m:+1:[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mTextBlob[0m[38;5;12m [39m[38;5;12m(http://textblob.readthedocs.org/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mProviding[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mconsistent[39m[38;5;12m [39m[38;5;12mAPI[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mdiving[39m[38;5;12m [39m[38;5;12minto[39m[38;5;12m [39m[38;5;12mcommon[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mprocessing[39m[38;5;12m [39m[38;5;12m(NLP)[39m[38;5;12m [39m[38;5;12mtasks.[39m[38;5;12m [39m[38;5;12mStands[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mgiant[39m[38;5;12m [39m[38;5;12mshoulders[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;14m[1mNatural[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m
|
||||
[38;5;14m[1mToolkit[0m[38;5;14m[1m [0m[38;5;14m[1m(NLTK)[0m[38;5;12m [39m[38;5;12m(https://www.nltk.org/)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;14m[1mPattern[0m[38;5;12m [39m[38;5;12m(https://github.com/clips/pattern),[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mplays[39m[38;5;12m [39m[38;5;12mnicely[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mboth[39m[38;5;12m [39m[38;5;12m:+1:[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mspaCy[0m[38;5;12m (https://github.com/explosion/spaCy) - Industrial strength NLP with Python and Cython :+1:[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mSpeedster[0m[38;5;12m (https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/speedster) - Automatically apply SOTA optimization techniques to achieve the maximum inference speed-up on your hardware[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mSpeedster[0m[38;5;12m [39m[38;5;12m(https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/speedster)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mAutomatically[39m[38;5;12m [39m[38;5;12mapply[39m[38;5;12m [39m[38;5;12mSOTA[39m[38;5;12m [39m[38;5;12moptimization[39m[38;5;12m [39m[38;5;12mtechniques[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12machieve[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mmaximum[39m[38;5;12m [39m[38;5;12minference[39m[38;5;12m [39m[38;5;12mspeed-up[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12myour[39m[38;5;12m [39m
|
||||
[38;5;12mhardware[39m
|
||||
[48;5;235m[38;5;249m- **textacy** (https://github.com/chartbeat-labs/textacy) - Higher level NLP built on spaCy[49m[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mgensim[0m[38;5;12m (https://radimrehurek.com/gensim/index.html) - Python library to conduct unsupervised semantic modelling from plain text :+1:[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mscattertext[0m[38;5;12m (https://github.com/JasonKessler/scattertext) - Python library to produce d3 visualizations of how language differs between corpora[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mGluonNLP[0m[38;5;12m [39m[38;5;12m(https://github.com/dmlc/gluon-nlp)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mA[39m[38;5;12m [39m[38;5;12mdeep[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mtoolkit[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mNLP,[39m[38;5;12m [39m[38;5;12mbuilt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mMXNet/Gluon,[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mresearch[39m[38;5;12m [39m[38;5;12mprototyping[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mindustrial[39m[38;5;12m [39m[38;5;12mdeployment[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mstate-of-the-art[39m[38;5;12m [39m[38;5;12mmodels[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mwide[39m[38;5;12m [39m[38;5;12mrange[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m
|
||||
[38;5;12mtasks.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mGluonNLP[0m[38;5;12m [39m[38;5;12m(https://github.com/dmlc/gluon-nlp)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mA[39m[38;5;12m [39m[38;5;12mdeep[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mtoolkit[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mNLP,[39m[38;5;12m [39m[38;5;12mbuilt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mMXNet/Gluon,[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mresearch[39m[38;5;12m [39m[38;5;12mprototyping[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mindustrial[39m[38;5;12m [39m[38;5;12mdeployment[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mstate-of-the-art[39m[38;5;12m [39m[38;5;12mmodels[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m
|
||||
[38;5;12mwide[39m[38;5;12m [39m[38;5;12mrange[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mtasks.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mAllenNLP[0m[38;5;12m (https://github.com/allenai/allennlp) - An NLP research library, built on PyTorch, for developing state-of-the-art deep learning models on a wide variety of linguistic tasks.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPyTorch-NLP[0m[38;5;12m [39m[38;5;12m(https://github.com/PetrochukM/PyTorch-NLP)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mresearch[39m[38;5;12m [39m[38;5;12mtoolkit[39m[38;5;12m [39m[38;5;12mdesigned[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12msupport[39m[38;5;12m [39m[38;5;12mrapid[39m[38;5;12m [39m[38;5;12mprototyping[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mbetter[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mloaders,[39m[38;5;12m [39m[38;5;12mword[39m[38;5;12m [39m[38;5;12mvector[39m[38;5;12m [39m[38;5;12mloaders,[39m[38;5;12m [39m[38;5;12mneural[39m[38;5;12m [39m[38;5;12mnetwork[39m[38;5;12m [39m[38;5;12mlayer[39m[38;5;12m [39m[38;5;12mrepresentations,[39m[38;5;12m [39m
|
||||
[38;5;12mcommon[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mmetrics[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mBLEU[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPyTorch-NLP[0m[38;5;12m [39m[38;5;12m(https://github.com/PetrochukM/PyTorch-NLP)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mresearch[39m[38;5;12m [39m[38;5;12mtoolkit[39m[38;5;12m [39m[38;5;12mdesigned[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12msupport[39m[38;5;12m [39m[38;5;12mrapid[39m[38;5;12m [39m[38;5;12mprototyping[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mbetter[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mloaders,[39m[38;5;12m [39m[38;5;12mword[39m[38;5;12m [39m[38;5;12mvector[39m[38;5;12m [39m[38;5;12mloaders,[39m[38;5;12m [39m[38;5;12mneural[39m[38;5;12m [39m[38;5;12mnetwork[39m[38;5;12m [39m[38;5;12mlayer[39m[38;5;12m [39m
|
||||
[38;5;12mrepresentations,[39m[38;5;12m [39m[38;5;12mcommon[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mmetrics[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mBLEU[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mRosetta[0m[38;5;12m (https://github.com/columbia-applied-data-science/rosetta) - Text processing tools and wrappers (e.g. Vowpal Wabbit)[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPyNLPl[0m[38;5;12m [39m[38;5;12m(https://github.com/proycon/pynlpl)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mNatural[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mProcessing[39m[38;5;12m [39m[38;5;12mLibrary.[39m[38;5;12m [39m[38;5;12mGeneral[39m[38;5;12m [39m[38;5;12mpurpose[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mlibrary[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mPython,[39m[38;5;12m [39m[38;5;12mhandles[39m[38;5;12m [39m[38;5;12msome[39m[38;5;12m [39m[38;5;12mspecific[39m[38;5;12m [39m[38;5;12mformats[39m[38;5;12m [39m[38;5;12mlike[39m[38;5;12m [39m[38;5;12mARPA[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mmodels,[39m[38;5;12m [39m[38;5;12mMoses[39m[38;5;12m [39m[38;5;12mphrasetables,[39m[38;5;12m [39m
|
||||
[38;5;12mGIZA++[39m[38;5;12m [39m[38;5;12malignments.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPyNLPl[0m[38;5;12m [39m[38;5;12m(https://github.com/proycon/pynlpl)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mNatural[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mProcessing[39m[38;5;12m [39m[38;5;12mLibrary.[39m[38;5;12m [39m[38;5;12mGeneral[39m[38;5;12m [39m[38;5;12mpurpose[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mlibrary[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mPython,[39m[38;5;12m [39m[38;5;12mhandles[39m[38;5;12m [39m[38;5;12msome[39m[38;5;12m [39m[38;5;12mspecific[39m[38;5;12m [39m[38;5;12mformats[39m[38;5;12m [39m[38;5;12mlike[39m[38;5;12m [39m[38;5;12mARPA[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mmodels,[39m[38;5;12m [39m
|
||||
[38;5;12mMoses[39m[38;5;12m [39m[38;5;12mphrasetables,[39m[38;5;12m [39m[38;5;12mGIZA++[39m[38;5;12m [39m[38;5;12malignments.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mfoliapy[0m[38;5;12m (https://github.com/proycon/foliapy) - Python library for working with [39m[38;5;14m[1mFoLiA[0m[38;5;12m (https://proycon.github.io/folia/), an XML format for linguistic annotation.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPySS3[0m[38;5;12m [39m[38;5;12m(https://github.com/sergioburdisso/pyss3)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mpackage[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mimplements[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mnovel[39m[38;5;12m [39m[38;5;12mwhite-box[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mmodel[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mclassification,[39m[38;5;12m [39m[38;5;12mcalled[39m[38;5;12m [39m[38;5;12mSS3.[39m[38;5;12m [39m[38;5;12mSince[39m[38;5;12m [39m[38;5;12mSS3[39m[38;5;12m [39m[38;5;12mhas[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mability[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mvisually[39m[38;5;12m [39m[38;5;12mexplain[39m[38;5;12m [39m
|
||||
[38;5;12mits[39m[38;5;12m [39m[38;5;12mrationale,[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mpackage[39m[38;5;12m [39m[38;5;12malso[39m[38;5;12m [39m[38;5;12mcomes[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12measy-to-use[39m[38;5;12m [39m[38;5;12minteractive[39m[38;5;12m [39m[38;5;12mvisualizations[39m[38;5;12m [39m[38;5;12mtools[39m[38;5;12m [39m[38;5;12m([39m[38;5;14m[1monline[0m[38;5;14m[1m [0m[38;5;14m[1mdemos[0m[38;5;12m [39m[38;5;12m(http://tworld.io/ss3/)).[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPySS3[0m[38;5;12m [39m[38;5;12m(https://github.com/sergioburdisso/pyss3)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mpackage[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mimplements[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mnovel[39m[38;5;12m [39m[38;5;12mwhite-box[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mmodel[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mclassification,[39m[38;5;12m [39m[38;5;12mcalled[39m[38;5;12m [39m[38;5;12mSS3.[39m[38;5;12m [39m[38;5;12mSince[39m[38;5;12m [39m[38;5;12mSS3[39m[38;5;12m [39m[38;5;12mhas[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mability[39m[38;5;12m [39m[38;5;12mto[39m
|
||||
[38;5;12mvisually[39m[38;5;12m [39m[38;5;12mexplain[39m[38;5;12m [39m[38;5;12mits[39m[38;5;12m [39m[38;5;12mrationale,[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mpackage[39m[38;5;12m [39m[38;5;12malso[39m[38;5;12m [39m[38;5;12mcomes[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12measy-to-use[39m[38;5;12m [39m[38;5;12minteractive[39m[38;5;12m [39m[38;5;12mvisualizations[39m[38;5;12m [39m[38;5;12mtools[39m[38;5;12m [39m[38;5;12m([39m[38;5;14m[1monline[0m[38;5;14m[1m [0m[38;5;14m[1mdemos[0m[38;5;12m [39m[38;5;12m(http://tworld.io/ss3/)).[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mjPTDP[0m[38;5;12m (https://github.com/datquocnguyen/jPTDP) - A toolkit for joint part-of-speech (POS) tagging and dependency parsing. jPTDP provides pre-trained models for 40+ languages.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mBigARTM[0m[38;5;12m (https://github.com/bigartm/bigartm) - a fast library for topic modelling[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mSnips NLU[0m[38;5;12m (https://github.com/snipsco/snips-nlu) - A production ready library for intent parsing[39m
|
||||
@@ -198,13 +202,13 @@
|
||||
[38;5;12m - [39m[38;5;14m[1mNatural Language Toolkit (NLTK)[0m[38;5;12m (https://www.nltk.org/) - A library containing a wide variety of NLP functionality, supporting over 50 corpora.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mNLP Architect[0m[38;5;12m (https://github.com/NervanaSystems/nlp-architect) - A library for exploring the state-of-the-art deep learning topologies and techniques for NLP and NLU[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mFlair[0m[38;5;12m (https://github.com/zalandoresearch/flair) - A very simple framework for state-of-the-art multilingual NLP built on PyTorch. Includes BERT, ELMo and Flair embeddings.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mKashgari[0m[38;5;12m [39m[38;5;12m(https://github.com/BrikerMan/Kashgari)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mSimple,[39m[38;5;12m [39m[38;5;12mKeras-powered[39m[38;5;12m [39m[38;5;12mmultilingual[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mframework,[39m[38;5;12m [39m[38;5;12mallows[39m[38;5;12m [39m[38;5;12myou[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mbuild[39m[38;5;12m [39m[38;5;12myour[39m[38;5;12m [39m[38;5;12mmodels[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12m5[39m[38;5;12m [39m[38;5;12mminutes[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mnamed[39m[38;5;12m [39m[38;5;12mentity[39m[38;5;12m [39m[38;5;12mrecognition[39m[38;5;12m [39m[38;5;12m(NER),[39m[38;5;12m [39m[38;5;12mpart-of-speech[39m[38;5;12m [39m[38;5;12mtagging[39m[38;5;12m [39m
|
||||
[38;5;12m(PoS)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mclassification[39m[38;5;12m [39m[38;5;12mtasks.[39m[38;5;12m [39m[38;5;12mIncludes[39m[38;5;12m [39m[38;5;12mBERT[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mword2vec[39m[38;5;12m [39m[38;5;12membedding.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mKashgari[0m[38;5;12m [39m[38;5;12m(https://github.com/BrikerMan/Kashgari)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mSimple,[39m[38;5;12m [39m[38;5;12mKeras-powered[39m[38;5;12m [39m[38;5;12mmultilingual[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mframework,[39m[38;5;12m [39m[38;5;12mallows[39m[38;5;12m [39m[38;5;12myou[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mbuild[39m[38;5;12m [39m[38;5;12myour[39m[38;5;12m [39m[38;5;12mmodels[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12m5[39m[38;5;12m [39m[38;5;12mminutes[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mnamed[39m[38;5;12m [39m[38;5;12mentity[39m[38;5;12m [39m[38;5;12mrecognition[39m[38;5;12m [39m[38;5;12m(NER),[39m[38;5;12m [39m
|
||||
[38;5;12mpart-of-speech[39m[38;5;12m [39m[38;5;12mtagging[39m[38;5;12m [39m[38;5;12m(PoS)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mclassification[39m[38;5;12m [39m[38;5;12mtasks.[39m[38;5;12m [39m[38;5;12mIncludes[39m[38;5;12m [39m[38;5;12mBERT[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mword2vec[39m[38;5;12m [39m[38;5;12membedding.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mFARM[0m[38;5;12m (https://github.com/deepset-ai/FARM) - Fast & easy transfer learning for NLP. Harvesting language models for the industry. Focus on Question Answering.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mHaystack[0m[38;5;12m [39m[38;5;12m(https://github.com/deepset-ai/haystack)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mEnd-to-end[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mframework[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mbuilding[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12msearch[39m[38;5;12m [39m[38;5;12minterfaces[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mdata.[39m[38;5;12m [39m[38;5;12mLeverages[39m[38;5;12m [39m[38;5;12mTransformers[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mState-of-the-Art[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mNLP.[39m[38;5;12m [39m[38;5;12mSupports[39m[38;5;12m [39m[38;5;12mDPR,[39m[38;5;12m [39m
|
||||
[38;5;12mElasticsearch,[39m[38;5;12m [39m[38;5;12mHuggingFace’s[39m[38;5;12m [39m[38;5;12mModelhub,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mmuch[39m[38;5;12m [39m[38;5;12mmore![39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mRita[0m[38;5;14m[1m [0m[38;5;14m[1mDSL[0m[38;5;12m [39m[38;5;12m(https://github.com/zaibacu/rita-dsl)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mDSL,[39m[38;5;12m [39m[38;5;12mloosely[39m[38;5;12m [39m[38;5;12mbased[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;14m[1mRUTA[0m[38;5;14m[1m [0m[38;5;14m[1mon[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mUIMA[0m[38;5;12m [39m[38;5;12m(https://uima.apache.org/ruta.html).[39m[38;5;12m [39m[38;5;12mAllows[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mdefine[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mpatterns[39m[38;5;12m [39m[38;5;12m(rule-based[39m[38;5;12m [39m[38;5;12mNLP)[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12mthen[39m[38;5;12m [39m[38;5;12mtranslated[39m
|
||||
[38;5;12minto[39m[38;5;12m [39m[38;5;14m[1mspaCy[0m[38;5;12m [39m[38;5;12m(https://spacy.io/),[39m[38;5;12m [39m[38;5;12mor[39m[38;5;12m [39m[38;5;12mif[39m[38;5;12m [39m[38;5;12myou[39m[38;5;12m [39m[38;5;12mprefer[39m[38;5;12m [39m[38;5;12mless[39m[38;5;12m [39m[38;5;12mfeatures[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mlightweight[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mregex[39m[38;5;12m [39m[38;5;12mpatterns.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mHaystack[0m[38;5;12m [39m[38;5;12m(https://github.com/deepset-ai/haystack)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mEnd-to-end[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mframework[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mbuilding[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12msearch[39m[38;5;12m [39m[38;5;12minterfaces[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mdata.[39m[38;5;12m [39m[38;5;12mLeverages[39m[38;5;12m [39m[38;5;12mTransformers[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mState-of-the-Art[39m[38;5;12m [39m[38;5;12mof[39m
|
||||
[38;5;12mNLP.[39m[38;5;12m [39m[38;5;12mSupports[39m[38;5;12m [39m[38;5;12mDPR,[39m[38;5;12m [39m[38;5;12mElasticsearch,[39m[38;5;12m [39m[38;5;12mHuggingFace’s[39m[38;5;12m [39m[38;5;12mModelhub,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mmuch[39m[38;5;12m [39m[38;5;12mmore![39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mRita[0m[38;5;14m[1m [0m[38;5;14m[1mDSL[0m[38;5;12m [39m[38;5;12m(https://github.com/zaibacu/rita-dsl)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mDSL,[39m[38;5;12m [39m[38;5;12mloosely[39m[38;5;12m [39m[38;5;12mbased[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;14m[1mRUTA[0m[38;5;14m[1m [0m[38;5;14m[1mon[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mUIMA[0m[38;5;12m [39m[38;5;12m(https://uima.apache.org/ruta.html).[39m[38;5;12m [39m[38;5;12mAllows[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mdefine[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mpatterns[39m[38;5;12m [39m[38;5;12m(rule-based[39m[38;5;12m [39m[38;5;12mNLP)[39m[38;5;12m [39m[38;5;12mwhich[39m
|
||||
[38;5;12mare[39m[38;5;12m [39m[38;5;12mthen[39m[38;5;12m [39m[38;5;12mtranslated[39m[38;5;12m [39m[38;5;12minto[39m[38;5;12m [39m[38;5;14m[1mspaCy[0m[38;5;12m [39m[38;5;12m(https://spacy.io/),[39m[38;5;12m [39m[38;5;12mor[39m[38;5;12m [39m[38;5;12mif[39m[38;5;12m [39m[38;5;12myou[39m[38;5;12m [39m[38;5;12mprefer[39m[38;5;12m [39m[38;5;12mless[39m[38;5;12m [39m[38;5;12mfeatures[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mlightweight[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mregex[39m[38;5;12m [39m[38;5;12mpatterns.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mTransformers[0m[38;5;12m (https://github.com/huggingface/transformers) - Natural Language Processing for TensorFlow 2.0 and PyTorch.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mTokenizers[0m[38;5;12m (https://github.com/huggingface/tokenizers) - Tokenizers optimized for Research and Production.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mfairSeq[0m[38;5;12m (https://github.com/pytorch/fairseq) Facebook AI Research implementations of SOTA seq2seq models in Pytorch. [39m
|
||||
@@ -218,11 +222,12 @@
|
||||
[38;5;12m- | [39m[38;5;14m[1mBack to Top[0m[38;5;12m (#contents)[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mInsNet[0m[38;5;12m (https://github.com/chncwang/InsNet) - A neural network library for building instance-dependent NLP models with padding-free dynamic batching.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mMIT Information Extraction Toolkit[0m[38;5;12m (https://github.com/mit-nlp/MITIE) - C, C++, and Python tools for named entity recognition and relation extraction[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mCRF++[0m[38;5;12m (https://taku910.github.io/crfpp/) - Open source implementation of Conditional Random Fields (CRFs) for segmenting/labeling sequential data & other Natural Language Processing tasks.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mCRF++[0m[38;5;12m [39m[38;5;12m(https://taku910.github.io/crfpp/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mOpen[39m[38;5;12m [39m[38;5;12msource[39m[38;5;12m [39m[38;5;12mimplementation[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mConditional[39m[38;5;12m [39m[38;5;12mRandom[39m[38;5;12m [39m[38;5;12mFields[39m[38;5;12m [39m[38;5;12m(CRFs)[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12msegmenting/labeling[39m[38;5;12m [39m[38;5;12msequential[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12m&[39m[38;5;12m [39m[38;5;12mother[39m[38;5;12m [39m[38;5;12mNatural[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mProcessing[39m[38;5;12m [39m
|
||||
[38;5;12mtasks.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mCRFsuite[0m[38;5;12m (http://www.chokkan.org/software/crfsuite/) - CRFsuite is an implementation of Conditional Random Fields (CRFs) for labeling sequential data.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mBLLIP Parser[0m[38;5;12m (https://github.com/BLLIP/bllip-parser) - BLLIP Natural Language Parser (also known as the Charniak-Johnson parser)[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mcolibri-core[0m[38;5;12m [39m[38;5;12m(https://github.com/proycon/colibri-core)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mC++[39m[38;5;12m [39m[38;5;12mlibrary,[39m[38;5;12m [39m[38;5;12mcommand[39m[38;5;12m [39m[38;5;12mline[39m[38;5;12m [39m[38;5;12mtools,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mbinding[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mextracting[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mworking[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mbasic[39m[38;5;12m [39m[38;5;12mlinguistic[39m[38;5;12m [39m[38;5;12mconstructions[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mn-grams[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mskipgrams[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m
|
||||
[38;5;12mquick[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mmemory-efficient[39m[38;5;12m [39m[38;5;12mway.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mcolibri-core[0m[38;5;12m [39m[38;5;12m(https://github.com/proycon/colibri-core)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mC++[39m[38;5;12m [39m[38;5;12mlibrary,[39m[38;5;12m [39m[38;5;12mcommand[39m[38;5;12m [39m[38;5;12mline[39m[38;5;12m [39m[38;5;12mtools,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mbinding[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mextracting[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mworking[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mbasic[39m[38;5;12m [39m[38;5;12mlinguistic[39m[38;5;12m [39m[38;5;12mconstructions[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mn-grams[39m
|
||||
[38;5;12mand[39m[38;5;12m [39m[38;5;12mskipgrams[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mquick[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mmemory-efficient[39m[38;5;12m [39m[38;5;12mway.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mucto[0m[38;5;12m (https://github.com/LanguageMachines/ucto) - Unicode-aware regular-expression based tokenizer for various languages. Tool and C++ library. Supports FoLiA format.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mlibfolia[0m[38;5;12m (https://github.com/LanguageMachines/libfolia) - C++ library for the [39m[38;5;14m[1mFoLiA format[0m[38;5;12m (https://proycon.github.io/folia/)[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mfrog[0m[38;5;12m (https://github.com/LanguageMachines/frog) - Memory-based NLP suite developed for Dutch: PoS tagger, lemmatiser, dependency parser, NER, shallow parser, morphological analyzer.[39m
|
||||
@@ -239,8 +244,8 @@
|
||||
[38;5;12m - [39m[38;5;14m[1mReVerb[0m[38;5;12m (https://github.com/knowitall/reverb/) Web-Scale Open Information Extraction[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mOpenRegex[0m[38;5;12m (https://github.com/knowitall/openregex) An efficient and flexible token-based regular expression language and engine.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mCogcompNLP[0m[38;5;12m (https://github.com/CogComp/cogcomp-nlp) - Core libraries developed in the U of Illinois' Cognitive Computation Group.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mMALLET[0m[38;5;12m [39m[38;5;12m(http://mallet.cs.umass.edu/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mMAchine[39m[38;5;12m [39m[38;5;12mLearning[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mLanguagE[39m[38;5;12m [39m[38;5;12mToolkit[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mpackage[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mstatistical[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mprocessing,[39m[38;5;12m [39m[38;5;12mdocument[39m[38;5;12m [39m[38;5;12mclassification,[39m[38;5;12m [39m[38;5;12mclustering,[39m[38;5;12m [39m[38;5;12mtopic[39m[38;5;12m [39m[38;5;12mmodeling,[39m[38;5;12m [39m[38;5;12minformation[39m[38;5;12m [39m
|
||||
[38;5;12mextraction,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mother[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mapplications[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mtext.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mMALLET[0m[38;5;12m [39m[38;5;12m(http://mallet.cs.umass.edu/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mMAchine[39m[38;5;12m [39m[38;5;12mLearning[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mLanguagE[39m[38;5;12m [39m[38;5;12mToolkit[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mpackage[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mstatistical[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mprocessing,[39m[38;5;12m [39m[38;5;12mdocument[39m[38;5;12m [39m[38;5;12mclassification,[39m[38;5;12m [39m[38;5;12mclustering,[39m[38;5;12m [39m[38;5;12mtopic[39m[38;5;12m [39m[38;5;12mmodeling,[39m[38;5;12m [39m
|
||||
[38;5;12minformation[39m[38;5;12m [39m[38;5;12mextraction,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mother[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mapplications[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mtext.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mRDRPOSTagger[0m[38;5;12m (https://github.com/datquocnguyen/RDRPOSTagger) - A robust POS tagging toolkit available (in both Java & Python) together with pre-trained models for 40+ languages.[39m
|
||||
|
||||
[38;5;12m- | [39m[38;5;14m[1mBack to Top[0m[38;5;12m (#contents)[39m
|
||||
@@ -253,8 +258,8 @@
|
||||
[38;5;12m - [39m[38;5;14m[1mtm[0m[38;5;12m (https://github.com/ispras/tm) - Implementation of topic modeling based on regularized multilingual [39m[38;5;14m[1mPLSA[0m[38;5;12m (https://en.wikipedia.org/wiki/Probabilistic_latent_semantic_analysis).[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mword2vec-scala[0m[38;5;12m (https://github.com/Refefer/word2vec-scala) - Scala interface to word2vec model; includes operations on vectors like word-distance and word-analogy.[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mEpic[0m[38;5;12m (https://github.com/dlwh/epic) - Epic is a high performance statistical parser written in Scala, along with a framework for building complex structured prediction models.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mNLP[0m[38;5;12m [39m[38;5;12m(https://github.com/JohnSnowLabs/spark-nlp)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mprocessing[39m[38;5;12m [39m[38;5;12mlibrary[39m[38;5;12m [39m[38;5;12mbuilt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mtop[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mApache[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mML[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mprovides[39m[38;5;12m [39m[38;5;12msimple,[39m[38;5;12m [39m[38;5;12mperformant[39m[38;5;12m [39m[38;5;12m&[39m[38;5;12m [39m[38;5;12maccurate[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mannotations[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m
|
||||
[38;5;12mmachine[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mpipelines[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mscale[39m[38;5;12m [39m[38;5;12measily[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mdistributed[39m[38;5;12m [39m[38;5;12menvironment.[39m
|
||||
[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mNLP[0m[38;5;12m [39m[38;5;12m(https://github.com/JohnSnowLabs/spark-nlp)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mprocessing[39m[38;5;12m [39m[38;5;12mlibrary[39m[38;5;12m [39m[38;5;12mbuilt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mtop[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mApache[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mML[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mprovides[39m[38;5;12m [39m[38;5;12msimple,[39m[38;5;12m [39m[38;5;12mperformant[39m[38;5;12m [39m[38;5;12m&[39m[38;5;12m [39m[38;5;12maccurate[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m
|
||||
[38;5;12mannotations[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m[38;5;12mlearning[39m[38;5;12m [39m[38;5;12mpipelines[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mscale[39m[38;5;12m [39m[38;5;12measily[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mdistributed[39m[38;5;12m [39m[38;5;12menvironment.[39m
|
||||
|
||||
[38;5;12m- | [39m[38;5;14m[1mBack to Top[0m[38;5;12m (#contents)[39m
|
||||
[38;5;12m - [39m[38;5;14m[1mtext2vec[0m[38;5;12m (https://github.com/dselivanov/text2vec) - Fast vectorization, topic modeling, distances and GloVe word embeddings in R.[39m
|
||||
@@ -304,15 +309,17 @@
|
||||
[38;5;12m- [39m[38;5;14m[1mWit-ai[0m[38;5;12m (https://github.com/wit-ai/wit) - Natural Language Interface for apps and devices[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mIBM Watson's Natural Language Understanding[0m[38;5;12m (https://github.com/watson-developer-cloud/natural-language-understanding-nodejs) - API and Github demo[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mAmazon Comprehend[0m[38;5;12m (https://aws.amazon.com/comprehend/) - NLP and ML suite covers most common tasks like NER, tagging, and sentiment analysis[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mGoogle[0m[38;5;14m[1m [0m[38;5;14m[1mCloud[0m[38;5;14m[1m [0m[38;5;14m[1mNatural[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mAPI[0m[38;5;12m [39m[38;5;12m(https://cloud.google.com/natural-language/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mSyntax[39m[38;5;12m [39m[38;5;12mAnalysis,[39m[38;5;12m [39m[38;5;12mNER,[39m[38;5;12m [39m[38;5;12mSentiment[39m[38;5;12m [39m[38;5;12mAnalysis,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mContent[39m[38;5;12m [39m[38;5;12mtagging[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12matleast[39m[38;5;12m [39m[38;5;12m9[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12minclude[39m[38;5;12m [39m[38;5;12mEnglish[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mChinese[39m[38;5;12m [39m[38;5;12m(Simplified[39m[38;5;12m [39m[38;5;12mand[39m
|
||||
[38;5;12mTraditional).[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mGoogle[0m[38;5;14m[1m [0m[38;5;14m[1mCloud[0m[38;5;14m[1m [0m[38;5;14m[1mNatural[0m[38;5;14m[1m [0m[38;5;14m[1mLanguage[0m[38;5;14m[1m [0m[38;5;14m[1mAPI[0m[38;5;12m [39m[38;5;12m(https://cloud.google.com/natural-language/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mSyntax[39m[38;5;12m [39m[38;5;12mAnalysis,[39m[38;5;12m [39m[38;5;12mNER,[39m[38;5;12m [39m[38;5;12mSentiment[39m[38;5;12m [39m[38;5;12mAnalysis,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mContent[39m[38;5;12m [39m[38;5;12mtagging[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12matleast[39m[38;5;12m [39m[38;5;12m9[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12minclude[39m[38;5;12m [39m[38;5;12mEnglish[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m
|
||||
[38;5;12mChinese[39m[38;5;12m [39m[38;5;12m(Simplified[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mTraditional).[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mParallelDots[0m[38;5;12m (https://www.paralleldots.com/text-analysis-apis) - High level Text Analysis API Service ranging from Sentiment Analysis to Intent Analysis[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mMicrosoft Cognitive Service[0m[38;5;12m (https://azure.microsoft.com/en-us/services/cognitive-services/text-analytics/)[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mTextRazor[0m[38;5;12m (https://www.textrazor.com/)[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mRosette[0m[38;5;12m (https://www.rosette.com/)[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mTextalytic[0m[38;5;12m (https://www.textalytic.com) - Natural Language Processing in the Browser with sentiment analysis, named entity extraction, POS tagging, word frequencies, topic modeling, word clouds, and more[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mTextalytic[0m[38;5;12m [39m[38;5;12m(https://www.textalytic.com)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNatural[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mProcessing[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mBrowser[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12msentiment[39m[38;5;12m [39m[38;5;12manalysis,[39m[38;5;12m [39m[38;5;12mnamed[39m[38;5;12m [39m[38;5;12mentity[39m[38;5;12m [39m[38;5;12mextraction,[39m[38;5;12m [39m[38;5;12mPOS[39m[38;5;12m [39m[38;5;12mtagging,[39m[38;5;12m [39m[38;5;12mword[39m[38;5;12m [39m[38;5;12mfrequencies,[39m[38;5;12m [39m[38;5;12mtopic[39m[38;5;12m [39m[38;5;12mmodeling,[39m[38;5;12m [39m[38;5;12mword[39m[38;5;12m [39m
|
||||
[38;5;12mclouds,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mmore[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mNLP Cloud[0m[38;5;12m (https://nlpcloud.io) - SpaCy NLP models (custom and pre-trained ones) served through a RESTful API for named entity recognition (NER), POS tagging, and more.[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mCloudmersive[0m[38;5;12m (https://cloudmersive.com/nlp-api) - Unified and free NLP APIs that perform actions such as speech tagging, text rephrasing, language translation/detection, and sentence parsing[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mCloudmersive[0m[38;5;12m [39m[38;5;12m(https://cloudmersive.com/nlp-api)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mUnified[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mfree[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mAPIs[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mperform[39m[38;5;12m [39m[38;5;12mactions[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mspeech[39m[38;5;12m [39m[38;5;12mtagging,[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mrephrasing,[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mtranslation/detection,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12msentence[39m[38;5;12m [39m
|
||||
[38;5;12mparsing[39m
|
||||
|
||||
[38;2;255;187;0m[4mAnnotation Tools[0m
|
||||
|
||||
@@ -329,14 +336,14 @@
|
||||
[38;5;12m- [39m[38;5;14m[1mLabel Studio[0m[38;5;12m (https://www.heartex.ai/) - Hosted and managed text annotation tool for teams, freemium based, costs $[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mDatasaur[0m[38;5;12m (https://datasaur.ai/) support various NLP tasks for individual or teams, freemium based[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mKonfuzio[0m[38;5;12m (https://konfuzio.com/en/) - team-first hosted and on-prem text, image and PDF annotation tool powered by active learning, freemium based, costs $[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mUBIAI[0m[38;5;12m [39m[38;5;12m(https://ubiai.tools/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mEasy-to-use[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12mtool[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mteams[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mmost[39m[38;5;12m [39m[38;5;12mcomprehensive[39m[38;5;12m [39m[38;5;12mauto-annotation[39m[38;5;12m [39m[38;5;12mfeatures.[39m[38;5;12m [39m[38;5;12mSupports[39m[38;5;12m [39m[38;5;12mNER,[39m[38;5;12m [39m[38;5;12mrelations[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdocument[39m[38;5;12m [39m[38;5;12mclassification[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mwell[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mOCR[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m
|
||||
[38;5;12minvoice[39m[38;5;12m [39m[38;5;12mlabeling,[39m[38;5;12m [39m[38;5;12mcosts[39m[38;5;12m [39m[38;5;12m$[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mShoonya[0m[38;5;12m [39m[38;5;12m(https://github.com/AI4Bharat/Shoonya-Backend)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mShoonya[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mfree[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mopen[39m[38;5;12m [39m[38;5;12msource[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12mplatform[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mwide[39m[38;5;12m [39m[38;5;12mvarities[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12morganization[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mworkspace[39m[38;5;12m [39m[38;5;12mlevel[39m[38;5;12m [39m[38;5;12mmanagement[39m[38;5;12m [39m[38;5;12msystem.[39m[38;5;12m [39m[38;5;12mShoonya[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m
|
||||
[38;5;12magnostic,[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mbe[39m[38;5;12m [39m[38;5;12mused[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;12mteams[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mannotate[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mvarious[39m[38;5;12m [39m[38;5;12mlevel[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mverification[39m[38;5;12m [39m[38;5;12mstages[39m[38;5;12m [39m[38;5;12mat[39m[38;5;12m [39m[38;5;12mscale.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mAnnotation[0m[38;5;14m[1m [0m[38;5;14m[1mLab[0m[38;5;12m [39m[38;5;12m(https://www.johnsnowlabs.com/annotation-lab/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mFree[39m[38;5;12m [39m[38;5;12mEnd-to-End[39m[38;5;12m [39m[38;5;12mNo-Code[39m[38;5;12m [39m[38;5;12mplatform[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mDL[39m[38;5;12m [39m[38;5;12mmodel[39m[38;5;12m [39m[38;5;12mtraining/tuning.[39m[38;5;12m [39m[38;5;12mOut-of-the-box[39m[38;5;12m [39m[38;5;12msupport[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mNamed[39m[38;5;12m [39m[38;5;12mEntity[39m[38;5;12m [39m[38;5;12mRecognition,[39m[38;5;12m [39m
|
||||
[38;5;12mClassification,[39m[38;5;12m [39m[38;5;12mRelation[39m[38;5;12m [39m[38;5;12mextraction[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mAssertion[39m[38;5;12m [39m[38;5;12mStatus[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mmodels.[39m[38;5;12m [39m[38;5;12mUnlimited[39m[38;5;12m [39m[38;5;12msupport[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12musers,[39m[38;5;12m [39m[38;5;12mteams,[39m[38;5;12m [39m[38;5;12mprojects,[39m[38;5;12m [39m[38;5;12mdocuments.[39m[38;5;12m [39m[38;5;12mNot[39m[38;5;12m [39m[38;5;12mFOSS.[39m[38;5;12m [39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mFLAT[0m[38;5;12m [39m[38;5;12m(https://github.com/proycon/flat)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mFLAT[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mweb-based[39m[38;5;12m [39m[38;5;12mlinguistic[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12menvironment[39m[38;5;12m [39m[38;5;12mbased[39m[38;5;12m [39m[38;5;12maround[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mFoLiA[0m[38;5;14m[1m [0m[38;5;14m[1mformat[0m[38;5;12m [39m[38;5;12m(http://proycon.github.io/folia),[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mrich[39m[38;5;12m [39m[38;5;12mXML-based[39m[38;5;12m [39m[38;5;12mformat[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mlinguistic[39m[38;5;12m [39m[38;5;12mannotation.[39m
|
||||
[38;5;12mFree[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mopen[39m[38;5;12m [39m[38;5;12msource.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mUBIAI[0m[38;5;12m [39m[38;5;12m(https://ubiai.tools/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mEasy-to-use[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12mtool[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mteams[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mmost[39m[38;5;12m [39m[38;5;12mcomprehensive[39m[38;5;12m [39m[38;5;12mauto-annotation[39m[38;5;12m [39m[38;5;12mfeatures.[39m[38;5;12m [39m[38;5;12mSupports[39m[38;5;12m [39m[38;5;12mNER,[39m[38;5;12m [39m[38;5;12mrelations[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdocument[39m[38;5;12m [39m[38;5;12mclassification[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mwell[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m
|
||||
[38;5;12mOCR[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12minvoice[39m[38;5;12m [39m[38;5;12mlabeling,[39m[38;5;12m [39m[38;5;12mcosts[39m[38;5;12m [39m[38;5;12m$[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mShoonya[0m[38;5;12m [39m[38;5;12m(https://github.com/AI4Bharat/Shoonya-Backend)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mShoonya[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mfree[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mopen[39m[38;5;12m [39m[38;5;12msource[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12mplatform[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mwide[39m[38;5;12m [39m[38;5;12mvarities[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12morganization[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mworkspace[39m[38;5;12m [39m[38;5;12mlevel[39m[38;5;12m [39m[38;5;12mmanagement[39m[38;5;12m [39m[38;5;12msystem.[39m[38;5;12m [39m
|
||||
[38;5;12mShoonya[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12magnostic,[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mbe[39m[38;5;12m [39m[38;5;12mused[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;12mteams[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mannotate[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mvarious[39m[38;5;12m [39m[38;5;12mlevel[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mverification[39m[38;5;12m [39m[38;5;12mstages[39m[38;5;12m [39m[38;5;12mat[39m[38;5;12m [39m[38;5;12mscale.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mAnnotation[0m[38;5;14m[1m [0m[38;5;14m[1mLab[0m[38;5;12m [39m[38;5;12m(https://www.johnsnowlabs.com/annotation-lab/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mFree[39m[38;5;12m [39m[38;5;12mEnd-to-End[39m[38;5;12m [39m[38;5;12mNo-Code[39m[38;5;12m [39m[38;5;12mplatform[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mDL[39m[38;5;12m [39m[38;5;12mmodel[39m[38;5;12m [39m[38;5;12mtraining/tuning.[39m[38;5;12m [39m[38;5;12mOut-of-the-box[39m[38;5;12m [39m[38;5;12msupport[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mNamed[39m[38;5;12m [39m[38;5;12mEntity[39m[38;5;12m [39m
|
||||
[38;5;12mRecognition,[39m[38;5;12m [39m[38;5;12mClassification,[39m[38;5;12m [39m[38;5;12mRelation[39m[38;5;12m [39m[38;5;12mextraction[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mAssertion[39m[38;5;12m [39m[38;5;12mStatus[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mmodels.[39m[38;5;12m [39m[38;5;12mUnlimited[39m[38;5;12m [39m[38;5;12msupport[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12musers,[39m[38;5;12m [39m[38;5;12mteams,[39m[38;5;12m [39m[38;5;12mprojects,[39m[38;5;12m [39m[38;5;12mdocuments.[39m[38;5;12m [39m[38;5;12mNot[39m[38;5;12m [39m[38;5;12mFOSS.[39m[38;5;12m [39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mFLAT[0m[38;5;12m [39m[38;5;12m(https://github.com/proycon/flat)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mFLAT[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mweb-based[39m[38;5;12m [39m[38;5;12mlinguistic[39m[38;5;12m [39m[38;5;12mannotation[39m[38;5;12m [39m[38;5;12menvironment[39m[38;5;12m [39m[38;5;12mbased[39m[38;5;12m [39m[38;5;12maround[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mFoLiA[0m[38;5;14m[1m [0m[38;5;14m[1mformat[0m[38;5;12m [39m[38;5;12m(http://proycon.github.io/folia),[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mrich[39m[38;5;12m [39m[38;5;12mXML-based[39m[38;5;12m [39m[38;5;12mformat[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m
|
||||
[38;5;12mlinguistic[39m[38;5;12m [39m[38;5;12mannotation.[39m[38;5;12m [39m[38;5;12mFree[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mopen[39m[38;5;12m [39m[38;5;12msource.[39m
|
||||
|
||||
|
||||
[38;2;255;187;0m[4mTechniques[0m
|
||||
@@ -347,17 +354,18 @@
|
||||
|
||||
[38;5;12m- Thumb Rule: [39m[38;5;14m[1mfastText >> GloVe > word2vec[0m
|
||||
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mword2vec[0m[38;5;12m [39m[38;5;12m(https://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mimplementation[0m[38;5;12m [39m[38;5;12m(https://code.google.com/archive/p/word2vec/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mexplainer[0m[38;5;14m[1m [0m[38;5;14m[1mblog[0m[38;5;12m [39m
|
||||
[38;5;12m(http://colah.github.io/posts/2014-07-NLP-RNNs-Representations/)[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mword2vec[0m[38;5;12m [39m[38;5;12m(https://papers.nips.cc/paper/5021-distributed-representations-of-words-and-phrases-and-their-compositionality.pdf)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mimplementation[0m[38;5;12m [39m[38;5;12m(https://code.google.com/archive/p/word2vec/)[39m[38;5;12m [39m[38;5;12m-[39m
|
||||
[38;5;14m[1mexplainer[0m[38;5;14m[1m [0m[38;5;14m[1mblog[0m[38;5;12m [39m[38;5;12m(http://colah.github.io/posts/2014-07-NLP-RNNs-Representations/)[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mglove[0m[38;5;12m (https://nlp.stanford.edu/pubs/glove.pdf) - [39m[38;5;14m[1mexplainer blog[0m[38;5;12m (https://blog.acolyer.org/2016/04/22/glove-global-vectors-for-word-representation/)[39m
|
||||
[38;5;12m- fasttext - [39m[38;5;14m[1mimplementation[0m[38;5;12m (https://github.com/facebookresearch/fastText) - [39m[38;5;14m[1mpaper[0m[38;5;12m (https://arxiv.org/abs/1607.04606) - [39m[38;5;14m[1mexplainer blog[0m[38;5;12m (https://towardsdatascience.com/fasttext-under-the-hood-11efc57b2b3)[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;12mfasttext[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mimplementation[0m[38;5;12m [39m[38;5;12m(https://github.com/facebookresearch/fastText)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mpaper[0m[38;5;12m [39m[38;5;12m(https://arxiv.org/abs/1607.04606)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mexplainer[0m[38;5;14m[1m [0m[38;5;14m[1mblog[0m[38;5;12m [39m
|
||||
[38;5;12m(https://towardsdatascience.com/fasttext-under-the-hood-11efc57b2b3)[39m
|
||||
|
||||
[38;2;255;187;0m[4mSentence and Language Model Based Word Embeddings[0m
|
||||
|
||||
[38;5;14m[1mBack to Top[0m[38;5;12m (#contents)[39m
|
||||
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;12mElMo[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mDeep[0m[38;5;14m[1m [0m[38;5;14m[1mContextualized[0m[38;5;14m[1m [0m[38;5;14m[1mWord[0m[38;5;14m[1m [0m[38;5;14m[1mRepresentations[0m[38;5;12m [39m[38;5;12m(https://arxiv.org/abs/1802.05365)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPyTorch[0m[38;5;14m[1m [0m[38;5;14m[1mimplmentation[0m[38;5;12m [39m[38;5;12m(https://github.com/allenai/allennlp/blob/master/tutorials/how_to/elmo.md)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mTF[0m[38;5;14m[1m [0m[38;5;14m[1mImplementation[0m[38;5;12m [39m
|
||||
[38;5;12m(https://github.com/allenai/bilm-tf)[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;12mElMo[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mDeep[0m[38;5;14m[1m [0m[38;5;14m[1mContextualized[0m[38;5;14m[1m [0m[38;5;14m[1mWord[0m[38;5;14m[1m [0m[38;5;14m[1mRepresentations[0m[38;5;12m [39m[38;5;12m(https://arxiv.org/abs/1802.05365)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPyTorch[0m[38;5;14m[1m [0m[38;5;14m[1mimplmentation[0m[38;5;12m [39m[38;5;12m(https://github.com/allenai/allennlp/blob/master/tutorials/how_to/elmo.md)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mTF[0m[38;5;14m[1m [0m
|
||||
[38;5;14m[1mImplementation[0m[38;5;12m [39m[38;5;12m(https://github.com/allenai/bilm-tf)[39m
|
||||
[38;5;12m- ULMFiT - [39m[38;5;14m[1mUniversal Language Model Fine-tuning for Text Classification[0m[38;5;12m (https://arxiv.org/abs/1801.06146) by Jeremy Howard and Sebastian Ruder[39m
|
||||
[38;5;12m- InferSent - [39m[38;5;14m[1mSupervised Learning of Universal Sentence Representations from Natural Language Inference Data[0m[38;5;12m (https://arxiv.org/abs/1705.02364) by facebook[39m
|
||||
[38;5;12m- CoVe - [39m[38;5;14m[1mLearned in Translation: Contextualized Word Vectors[0m[38;5;12m (https://arxiv.org/abs/1708.00107)[39m
|
||||
@@ -388,12 +396,13 @@
|
||||
|
||||
[38;5;14m[1mBack to Top[0m[38;5;12m (#contents)[39m
|
||||
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mUDPipe[0m[38;5;12m [39m[38;5;12m(https://github.com/ufal/udpipe)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mtrainable[39m[38;5;12m [39m[38;5;12mpipeline[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mtokenizing,[39m[38;5;12m [39m[38;5;12mtagging,[39m[38;5;12m [39m[38;5;12mlemmatizing[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mparsing[39m[38;5;12m [39m[38;5;12mUniversal[39m[38;5;12m [39m[38;5;12mTreebanks[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mother[39m[38;5;12m [39m[38;5;12mCoNLL-U[39m[38;5;12m [39m[38;5;12mfiles.[39m[38;5;12m [39m[38;5;12mPrimarily[39m[38;5;12m [39m[38;5;12mwritten[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mC++,[39m[38;5;12m [39m[38;5;12moffers[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mfast[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m
|
||||
[38;5;12mreliable[39m[38;5;12m [39m[38;5;12msolution[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mmultilingual[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mprocessing.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mNLP-Cube[0m[38;5;12m [39m[38;5;12m(https://github.com/adobe/NLP-Cube)[39m[38;5;12m [39m[38;5;12m:[39m[38;5;12m [39m[38;5;12mNatural[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mProcessing[39m[38;5;12m [39m[38;5;12mPipeline[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mSentence[39m[38;5;12m [39m[38;5;12mSplitting,[39m[38;5;12m [39m[38;5;12mTokenization,[39m[38;5;12m [39m[38;5;12mLemmatization,[39m[38;5;12m [39m[38;5;12mPart-of-speech[39m[38;5;12m [39m[38;5;12mTagging[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mDependency[39m[38;5;12m [39m[38;5;12mParsing.[39m[38;5;12m [39m[38;5;12mNew[39m[38;5;12m [39m[38;5;12mplatform,[39m[38;5;12m [39m[38;5;12mwritten[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m
|
||||
[38;5;12mPython[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mDynet[39m[38;5;12m [39m[38;5;12m2.0.[39m[38;5;12m [39m[38;5;12mOffers[39m[38;5;12m [39m[38;5;12mstandalone[39m[38;5;12m [39m[38;5;12m(CLI/Python[39m[38;5;12m [39m[38;5;12mbindings)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mserver[39m[38;5;12m [39m[38;5;12mfunctionality[39m[38;5;12m [39m[38;5;12m(REST[39m[38;5;12m [39m[38;5;12mAPI).[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mUralicNLP[0m[38;5;12m [39m[38;5;12m(https://github.com/mikahama/uralicNLP)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mlibrary[39m[38;5;12m [39m[38;5;12mmostly[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mmany[39m[38;5;12m [39m[38;5;12mendangered[39m[38;5;12m [39m[38;5;12mUralic[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mSami[39m[38;5;12m [39m[38;5;12mlanguages,[39m[38;5;12m [39m[38;5;12mMordvin[39m[38;5;12m [39m[38;5;12mlanguages,[39m[38;5;12m [39m[38;5;12mMari[39m[38;5;12m [39m[38;5;12mlanguages,[39m[38;5;12m [39m[38;5;12mKomi[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mso[39m[38;5;12m [39m[38;5;12mon.[39m[38;5;12m [39m[38;5;12mAlso[39m[38;5;12m [39m[38;5;12msome[39m[38;5;12m [39m
|
||||
[38;5;12mnon-endangered[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12msupported[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mFinnish[39m[38;5;12m [39m[38;5;12mtogether[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mnon-Uralic[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mSwedish[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mArabic.[39m[38;5;12m [39m[38;5;12mUralicNLP[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mdo[39m[38;5;12m [39m[38;5;12mmorphological[39m[38;5;12m [39m[38;5;12manalysis,[39m[38;5;12m [39m[38;5;12mgeneration,[39m[38;5;12m [39m[38;5;12mlemmatization[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdisambiguation.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mUDPipe[0m[38;5;12m [39m[38;5;12m(https://github.com/ufal/udpipe)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mtrainable[39m[38;5;12m [39m[38;5;12mpipeline[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mtokenizing,[39m[38;5;12m [39m[38;5;12mtagging,[39m[38;5;12m [39m[38;5;12mlemmatizing[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mparsing[39m[38;5;12m [39m[38;5;12mUniversal[39m[38;5;12m [39m[38;5;12mTreebanks[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mother[39m[38;5;12m [39m[38;5;12mCoNLL-U[39m[38;5;12m [39m[38;5;12mfiles.[39m[38;5;12m [39m[38;5;12mPrimarily[39m[38;5;12m [39m[38;5;12mwritten[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mC++,[39m[38;5;12m [39m
|
||||
[38;5;12moffers[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mfast[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mreliable[39m[38;5;12m [39m[38;5;12msolution[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mmultilingual[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mprocessing.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mNLP-Cube[0m[38;5;12m [39m[38;5;12m(https://github.com/adobe/NLP-Cube)[39m[38;5;12m [39m[38;5;12m:[39m[38;5;12m [39m[38;5;12mNatural[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mProcessing[39m[38;5;12m [39m[38;5;12mPipeline[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mSentence[39m[38;5;12m [39m[38;5;12mSplitting,[39m[38;5;12m [39m[38;5;12mTokenization,[39m[38;5;12m [39m[38;5;12mLemmatization,[39m[38;5;12m [39m[38;5;12mPart-of-speech[39m[38;5;12m [39m[38;5;12mTagging[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mDependency[39m[38;5;12m [39m[38;5;12mParsing.[39m[38;5;12m [39m[38;5;12mNew[39m[38;5;12m [39m
|
||||
[38;5;12mplatform,[39m[38;5;12m [39m[38;5;12mwritten[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mDynet[39m[38;5;12m [39m[38;5;12m2.0.[39m[38;5;12m [39m[38;5;12mOffers[39m[38;5;12m [39m[38;5;12mstandalone[39m[38;5;12m [39m[38;5;12m(CLI/Python[39m[38;5;12m [39m[38;5;12mbindings)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mserver[39m[38;5;12m [39m[38;5;12mfunctionality[39m[38;5;12m [39m[38;5;12m(REST[39m[38;5;12m [39m[38;5;12mAPI).[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mUralicNLP[0m[38;5;12m [39m[38;5;12m(https://github.com/mikahama/uralicNLP)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mlibrary[39m[38;5;12m [39m[38;5;12mmostly[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mmany[39m[38;5;12m [39m[38;5;12mendangered[39m[38;5;12m [39m[38;5;12mUralic[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mSami[39m[38;5;12m [39m[38;5;12mlanguages,[39m[38;5;12m [39m[38;5;12mMordvin[39m[38;5;12m [39m[38;5;12mlanguages,[39m[38;5;12m [39m[38;5;12mMari[39m[38;5;12m [39m[38;5;12mlanguages,[39m[38;5;12m [39m[38;5;12mKomi[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12mand[39m
|
||||
[38;5;12mso[39m[38;5;12m [39m[38;5;12mon.[39m[38;5;12m [39m[38;5;12mAlso[39m[38;5;12m [39m[38;5;12msome[39m[38;5;12m [39m[38;5;12mnon-endangered[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12msupported[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mFinnish[39m[38;5;12m [39m[38;5;12mtogether[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mnon-Uralic[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mSwedish[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mArabic.[39m[38;5;12m [39m[38;5;12mUralicNLP[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mdo[39m[38;5;12m [39m[38;5;12mmorphological[39m[38;5;12m [39m[38;5;12manalysis,[39m[38;5;12m [39m[38;5;12mgeneration,[39m[38;5;12m [39m
|
||||
[38;5;12mlemmatization[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdisambiguation.[39m
|
||||
|
||||
[38;2;255;187;0m[4mNLP in Korean[0m
|
||||
|
||||
@@ -466,8 +475,8 @@
|
||||
|
||||
[38;2;255;187;0m[4mLibraries[0m
|
||||
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mspanlp[0m[38;5;12m [39m[38;5;12m(https://github.com/jfreddypuentes/spanlp)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mlibrary[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mdetect,[39m[38;5;12m [39m[38;5;12mcensor[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mclean[39m[38;5;12m [39m[38;5;12mprofanity,[39m[38;5;12m [39m[38;5;12mvulgarities,[39m[38;5;12m [39m[38;5;12mhateful[39m[38;5;12m [39m[38;5;12mwords,[39m[38;5;12m [39m[38;5;12mracism,[39m[38;5;12m [39m[38;5;12mxenophobia[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mbullying[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mtexts[39m[38;5;12m [39m[38;5;12mwritten[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mSpanish.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12mcontains[39m[38;5;12m [39m
|
||||
[38;5;12mdata[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12m21[39m[38;5;12m [39m[38;5;12mSpanish-speaking[39m[38;5;12m [39m[38;5;12mcountries.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mspanlp[0m[38;5;12m [39m[38;5;12m(https://github.com/jfreddypuentes/spanlp)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mlibrary[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mdetect,[39m[38;5;12m [39m[38;5;12mcensor[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mclean[39m[38;5;12m [39m[38;5;12mprofanity,[39m[38;5;12m [39m[38;5;12mvulgarities,[39m[38;5;12m [39m[38;5;12mhateful[39m[38;5;12m [39m[38;5;12mwords,[39m[38;5;12m [39m[38;5;12mracism,[39m[38;5;12m [39m[38;5;12mxenophobia[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mbullying[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mtexts[39m[38;5;12m [39m[38;5;12mwritten[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m
|
||||
[38;5;12mSpanish.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12mcontains[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12m21[39m[38;5;12m [39m[38;5;12mSpanish-speaking[39m[38;5;12m [39m[38;5;12mcountries.[39m
|
||||
|
||||
[38;2;255;187;0m[4mData[0m
|
||||
|
||||
@@ -504,8 +513,8 @@
|
||||
[38;2;255;187;0m[4mCorpora/Datasets that need a login/access can be gained via email[0m
|
||||
|
||||
[38;5;12m- [39m[38;5;14m[1mSAIL 2015[0m[38;5;12m (http://amitavadas.com/SAIL/) Twitter and Facebook labelled sentiment samples in Hindi, Bengali, Tamil, Telugu.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mIIT[0m[38;5;14m[1m [0m[38;5;14m[1mBombay[0m[38;5;14m[1m [0m[38;5;14m[1mNLP[0m[38;5;14m[1m [0m[38;5;14m[1mResources[0m[38;5;12m [39m[38;5;12m(http://www.cfilt.iitb.ac.in/Sentiment_Analysis_Resources.html)[39m[38;5;12m [39m[38;5;12mSentiwordnet,[39m[38;5;12m [39m[38;5;12mMovie[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mTourism[39m[38;5;12m [39m[38;5;12mparallel[39m[38;5;12m [39m[38;5;12mlabelled[39m[38;5;12m [39m[38;5;12mcorpora,[39m[38;5;12m [39m[38;5;12mpolarity[39m[38;5;12m [39m[38;5;12mlabelled[39m[38;5;12m [39m[38;5;12msense[39m[38;5;12m [39m[38;5;12mannotated[39m[38;5;12m [39m[38;5;12mcorpus,[39m[38;5;12m [39m[38;5;12mMarathi[39m[38;5;12m [39m[38;5;12mpolarity[39m[38;5;12m [39m
|
||||
[38;5;12mlabelled[39m[38;5;12m [39m[38;5;12mcorpus.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mIIT[0m[38;5;14m[1m [0m[38;5;14m[1mBombay[0m[38;5;14m[1m [0m[38;5;14m[1mNLP[0m[38;5;14m[1m [0m[38;5;14m[1mResources[0m[38;5;12m [39m[38;5;12m(http://www.cfilt.iitb.ac.in/Sentiment_Analysis_Resources.html)[39m[38;5;12m [39m[38;5;12mSentiwordnet,[39m[38;5;12m [39m[38;5;12mMovie[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mTourism[39m[38;5;12m [39m[38;5;12mparallel[39m[38;5;12m [39m[38;5;12mlabelled[39m[38;5;12m [39m[38;5;12mcorpora,[39m[38;5;12m [39m[38;5;12mpolarity[39m[38;5;12m [39m[38;5;12mlabelled[39m[38;5;12m [39m[38;5;12msense[39m[38;5;12m [39m[38;5;12mannotated[39m[38;5;12m [39m[38;5;12mcorpus,[39m
|
||||
[38;5;12mMarathi[39m[38;5;12m [39m[38;5;12mpolarity[39m[38;5;12m [39m[38;5;12mlabelled[39m[38;5;12m [39m[38;5;12mcorpus.[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mTDIL-IC aggregates a lot of useful resources and provides access to otherwise gated datasets[0m[38;5;12m (https://tdil-dc.in/index.php?option=com_catalogue&task=viewTools&id=83&lang=en)[39m
|
||||
|
||||
[38;2;255;187;0m[4mLanguage Models and Word Embeddings[0m
|
||||
@@ -521,9 +530,10 @@
|
||||
|
||||
[38;5;12m- [39m[38;5;14m[1mMulti-Task Deep Morphological Analyzer[0m[38;5;12m (https://github.com/Saurav0074/mt-dma) Deep Network based Morphological Parser for Hindi and Urdu[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mAnoop Kunchukuttan[0m[38;5;12m (https://github.com/anoopkunchukuttan/indic_nlp_library) 18 Languages, whole host of features from tokenization to translation[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mSivaReddy's Dependency Parser[0m[38;5;12m (http://sivareddy.in/downloads) Dependency Parser and Pos Tagger for Kannada, Hindi and Telugu. [39m[38;5;14m[1mPython3 Port[0m[38;5;12m (https://github.com/CalmDownKarm/sivareddydependencyparser)[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1miNLTK[0m[38;5;12m [39m[38;5;12m(https://github.com/goru001/inltk)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mA[39m[38;5;12m [39m[38;5;12mNatural[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mToolkit[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mIndic[39m[38;5;12m [39m[38;5;12mLanguages[39m[38;5;12m [39m[38;5;12m(Indian[39m[38;5;12m [39m[38;5;12msubcontinent[39m[38;5;12m [39m[38;5;12mlanguages)[39m[38;5;12m [39m[38;5;12mbuilt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mtop[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mPytorch/Fastai,[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12maims[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mprovide[39m[38;5;12m [39m[38;5;12mout[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mbox[39m[38;5;12m [39m[38;5;12msupport[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mcommon[39m
|
||||
[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mtasks.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mSivaReddy's[0m[38;5;14m[1m [0m[38;5;14m[1mDependency[0m[38;5;14m[1m [0m[38;5;14m[1mParser[0m[38;5;12m [39m[38;5;12m(http://sivareddy.in/downloads)[39m[38;5;12m [39m[38;5;12mDependency[39m[38;5;12m [39m[38;5;12mParser[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mPos[39m[38;5;12m [39m[38;5;12mTagger[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mKannada,[39m[38;5;12m [39m[38;5;12mHindi[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mTelugu.[39m[38;5;12m [39m[38;5;14m[1mPython3[0m[38;5;14m[1m [0m[38;5;14m[1mPort[0m[38;5;12m [39m
|
||||
[38;5;12m(https://github.com/CalmDownKarm/sivareddydependencyparser)[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1miNLTK[0m[38;5;12m [39m[38;5;12m(https://github.com/goru001/inltk)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mA[39m[38;5;12m [39m[38;5;12mNatural[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mToolkit[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mIndic[39m[38;5;12m [39m[38;5;12mLanguages[39m[38;5;12m [39m[38;5;12m(Indian[39m[38;5;12m [39m[38;5;12msubcontinent[39m[38;5;12m [39m[38;5;12mlanguages)[39m[38;5;12m [39m[38;5;12mbuilt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mtop[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mPytorch/Fastai,[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12maims[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mprovide[39m[38;5;12m [39m[38;5;12mout[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m
|
||||
[38;5;12mbox[39m[38;5;12m [39m[38;5;12msupport[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mcommon[39m[38;5;12m [39m[38;5;12mNLP[39m[38;5;12m [39m[38;5;12mtasks.[39m
|
||||
|
||||
[38;2;255;187;0m[4mNLP in Thai[0m
|
||||
|
||||
@@ -566,8 +576,8 @@
|
||||
[38;5;12m- [39m[38;5;14m[1mVIVOS[0m[38;5;12m (https://ailab.hcmus.edu.vn/vivos/) - a free Vietnamese speech corpus consisting of 15 hours of recording speech by AILab[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mVNTQcorpus(big).txt[0m[38;5;12m (http://viet.jnlp.org/download-du-lieu-tu-vung-corpus) - 1.75 million sentences in news[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mViText2SQL[0m[38;5;12m (https://github.com/VinAIResearch/ViText2SQL) - A dataset for Vietnamese Text-to-SQL semantic parsing (EMNLP-2020 Findings)[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mEVB[0m[38;5;14m[1m [0m[38;5;14m[1mCorpus[0m[38;5;12m [39m[38;5;12m(https://github.com/qhungngo/EVBCorpus)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12m20,000,000[39m[38;5;12m [39m[38;5;12mwords[39m[38;5;12m [39m[38;5;12m(20[39m[38;5;12m [39m[38;5;12mmillion)[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12m15[39m[38;5;12m [39m[38;5;12mbilingual[39m[38;5;12m [39m[38;5;12mbooks,[39m[38;5;12m [39m[38;5;12m100[39m[38;5;12m [39m[38;5;12mparallel[39m[38;5;12m [39m[38;5;12mEnglish-Vietnamese[39m[38;5;12m [39m[38;5;12m/[39m[38;5;12m [39m[38;5;12mVietnamese-English[39m[38;5;12m [39m[38;5;12mtexts,[39m[38;5;12m [39m[38;5;12m250[39m[38;5;12m [39m[38;5;12mparallel[39m[38;5;12m [39m[38;5;12mlaw[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mordinance[39m[38;5;12m [39m[38;5;12mtexts,[39m[38;5;12m [39m
|
||||
[38;5;12m5,000[39m[38;5;12m [39m[38;5;12mnews[39m[38;5;12m [39m[38;5;12marticles,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12m2,000[39m[38;5;12m [39m[38;5;12mfilm[39m[38;5;12m [39m[38;5;12msubtitles.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mEVB[0m[38;5;14m[1m [0m[38;5;14m[1mCorpus[0m[38;5;12m [39m[38;5;12m(https://github.com/qhungngo/EVBCorpus)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12m20,000,000[39m[38;5;12m [39m[38;5;12mwords[39m[38;5;12m [39m[38;5;12m(20[39m[38;5;12m [39m[38;5;12mmillion)[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12m15[39m[38;5;12m [39m[38;5;12mbilingual[39m[38;5;12m [39m[38;5;12mbooks,[39m[38;5;12m [39m[38;5;12m100[39m[38;5;12m [39m[38;5;12mparallel[39m[38;5;12m [39m[38;5;12mEnglish-Vietnamese[39m[38;5;12m [39m[38;5;12m/[39m[38;5;12m [39m[38;5;12mVietnamese-English[39m[38;5;12m [39m[38;5;12mtexts,[39m[38;5;12m [39m[38;5;12m250[39m[38;5;12m [39m[38;5;12mparallel[39m[38;5;12m [39m[38;5;12mlaw[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m
|
||||
[38;5;12mordinance[39m[38;5;12m [39m[38;5;12mtexts,[39m[38;5;12m [39m[38;5;12m5,000[39m[38;5;12m [39m[38;5;12mnews[39m[38;5;12m [39m[38;5;12marticles,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12m2,000[39m[38;5;12m [39m[38;5;12mfilm[39m[38;5;12m [39m[38;5;12msubtitles.[39m
|
||||
|
||||
|
||||
[38;2;255;187;0m[4mNLP for Dutch[0m
|
||||
@@ -613,34 +623,35 @@
|
||||
[38;2;255;187;0m[4mLibraries[0m
|
||||
[38;5;12m- [39m[38;5;14m[1mHazm[0m[38;5;12m (https://github.com/roshan-research/hazm) - Persian NLP Toolkit.[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mParsivar[0m[38;5;12m (https://github.com/ICTRC/Parsivar): A Language Processing Toolkit for Persian[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPerke[0m[38;5;12m [39m[38;5;12m(https://github.com/AlirezaTheH/perke):[39m[38;5;12m [39m[38;5;12mPerke[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mkeyphrase[39m[38;5;12m [39m[38;5;12mextraction[39m[38;5;12m [39m[38;5;12mpackage[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mlanguage.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12mprovides[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mend-to-end[39m[38;5;12m [39m[38;5;12mkeyphrase[39m[38;5;12m [39m[38;5;12mextraction[39m[38;5;12m [39m[38;5;12mpipeline[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12meach[39m[38;5;12m [39m[38;5;12mcomponent[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mbe[39m[38;5;12m [39m[38;5;12measily[39m[38;5;12m [39m
|
||||
[38;5;12mmodified[39m[38;5;12m [39m[38;5;12mor[39m[38;5;12m [39m[38;5;12mextended[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mdevelop[39m[38;5;12m [39m[38;5;12mnew[39m[38;5;12m [39m[38;5;12mmodels.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPerke[0m[38;5;12m [39m[38;5;12m(https://github.com/AlirezaTheH/perke):[39m[38;5;12m [39m[38;5;12mPerke[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12mkeyphrase[39m[38;5;12m [39m[38;5;12mextraction[39m[38;5;12m [39m[38;5;12mpackage[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mlanguage.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12mprovides[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mend-to-end[39m[38;5;12m [39m[38;5;12mkeyphrase[39m[38;5;12m [39m[38;5;12mextraction[39m[38;5;12m [39m[38;5;12mpipeline[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12meach[39m[38;5;12m [39m
|
||||
[38;5;12mcomponent[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mbe[39m[38;5;12m [39m[38;5;12measily[39m[38;5;12m [39m[38;5;12mmodified[39m[38;5;12m [39m[38;5;12mor[39m[38;5;12m [39m[38;5;12mextended[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mdevelop[39m[38;5;12m [39m[38;5;12mnew[39m[38;5;12m [39m[38;5;12mmodels.[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mPerstem[0m[38;5;12m (https://github.com/jonsafari/perstem): Persian stemmer, morphological analyzer, transliterator, and partial part-of-speech tagger[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mParsiAnalyzer[0m[38;5;12m (https://github.com/NarimanN2/ParsiAnalyzer): Persian Analyzer For Elasticsearch[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mvirastar[0m[38;5;12m (https://github.com/aziz/virastar): Cleaning up Persian text![39m
|
||||
|
||||
[38;2;255;187;0m[4mDatasets[0m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mBijankhan[0m[38;5;14m[1m [0m[38;5;14m[1mCorpus[0m[38;5;12m [39m[38;5;12m(https://dbrg.ut.ac.ir/بیژن%E2%80%8Cخان/):[39m[38;5;12m [39m[38;5;12mBijankhan[39m[38;5;12m [39m[38;5;12mcorpus[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mtagged[39m[38;5;12m [39m[38;5;12mcorpus[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12msuitable[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mprocessing[39m[38;5;12m [39m[38;5;12mresearch[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12m(Farsi)[39m[38;5;12m [39m[38;5;12mlanguage.[39m[38;5;12m [39m[38;5;12mThis[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m
|
||||
[38;5;12mgathered[39m[38;5;12m [39m[38;5;12mform[39m[38;5;12m [39m[38;5;12mdaily[39m[38;5;12m [39m[38;5;12mnews[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mcommon[39m[38;5;12m [39m[38;5;12mtexts.[39m[38;5;12m [39m[38;5;12mIn[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mall[39m[38;5;12m [39m[38;5;12mdocuments[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12mcategorized[39m[38;5;12m [39m[38;5;12minto[39m[38;5;12m [39m[38;5;12mdifferent[39m[38;5;12m [39m[38;5;12msubjects[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mpolitical,[39m[38;5;12m [39m[38;5;12mcultural[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mso[39m[38;5;12m [39m[38;5;12mon.[39m[38;5;12m [39m[38;5;12mTotally,[39m[38;5;12m [39m[38;5;12mthere[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12m4300[39m[38;5;12m [39m[38;5;12mdifferent[39m[38;5;12m [39m[38;5;12msubjects.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m
|
||||
[38;5;12mBijankhan[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mcontains[39m[38;5;12m [39m[38;5;12mabout[39m[38;5;12m [39m[38;5;12m2.6[39m[38;5;12m [39m[38;5;12mmillions[39m[38;5;12m [39m[38;5;12mmanually[39m[38;5;12m [39m[38;5;12mtagged[39m[38;5;12m [39m[38;5;12mwords[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mtag[39m[38;5;12m [39m[38;5;12mset[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mcontains[39m[38;5;12m [39m[38;5;12m40[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mPOS[39m[38;5;12m [39m[38;5;12mtags.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mUppsala[0m[38;5;14m[1m [0m[38;5;14m[1mPersian[0m[38;5;14m[1m [0m[38;5;14m[1mCorpus[0m[38;5;14m[1m [0m[38;5;14m[1m(UPC)[0m[38;5;12m [39m[38;5;12m(https://sites.google.com/site/mojganserajicom/home/upc):[39m[38;5;12m [39m[38;5;12mUppsala[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mCorpus[39m[38;5;12m [39m[38;5;12m(UPC)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mlarge,[39m[38;5;12m [39m[38;5;12mfreely[39m[38;5;12m [39m[38;5;12mavailable[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mcorpus.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mcorpus[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mmodified[39m[38;5;12m [39m[38;5;12mversion[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m
|
||||
[38;5;12mBijankhan[39m[38;5;12m [39m[38;5;12mcorpus[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12madditional[39m[38;5;12m [39m[38;5;12msentence[39m[38;5;12m [39m[38;5;12msegmentation[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mconsistent[39m[38;5;12m [39m[38;5;12mtokenization[39m[38;5;12m [39m[38;5;12mcontaining[39m[38;5;12m [39m[38;5;12m2,704,028[39m[38;5;12m [39m[38;5;12mtokens[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mannotated[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12m31[39m[38;5;12m [39m[38;5;12mpart-of-speech[39m[38;5;12m [39m[38;5;12mtags.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mpart-of-speech[39m[38;5;12m [39m[38;5;12mtags[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12mlisted[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mexplanations[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m
|
||||
[38;5;14m[1mthis[0m[38;5;14m[1m [0m[38;5;14m[1mtable[0m[38;5;12m [39m[38;5;12m(https://sites.google.com/site/mojganserajicom/home/upc/Table_tag.pdf).[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mLarge-Scale[0m[38;5;14m[1m [0m[38;5;14m[1mColloquial[0m[38;5;14m[1m [0m[38;5;14m[1mPersian[0m[38;5;12m [39m[38;5;12m(http://hdl.handle.net/11234/1-3195):[39m[38;5;12m [39m[38;5;12mLarge[39m[38;5;12m [39m[38;5;12mScale[39m[38;5;12m [39m[38;5;12mColloquial[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mDataset[39m[38;5;12m [39m[38;5;12m(LSCP)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mhierarchically[39m[38;5;12m [39m[38;5;12morganized[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12masemantic[39m[38;5;12m [39m[38;5;12mtaxonomy[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mfocuses[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mmulti-task[39m[38;5;12m [39m[38;5;12minformal[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m
|
||||
[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12munderstanding[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mcomprehensive[39m[38;5;12m [39m[38;5;12mproblem.[39m[38;5;12m [39m[38;5;12mLSCP[39m[38;5;12m [39m[38;5;12mincludes[39m[38;5;12m [39m[38;5;12m120M[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12m27M[39m[38;5;12m [39m[38;5;12mcasual[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mtweets[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mits[39m[38;5;12m [39m[38;5;12mdependency[39m[38;5;12m [39m[38;5;12mrelations[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12msyntactic[39m[38;5;12m [39m[38;5;12mannotation,[39m[38;5;12m [39m[38;5;12mPart-of-speech[39m[38;5;12m [39m[38;5;12mtags,[39m[38;5;12m [39m[38;5;12msentiment[39m[38;5;12m [39m[38;5;12mpolarity[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m
|
||||
[38;5;12mautomatic[39m[38;5;12m [39m[38;5;12mtranslation[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12moriginal[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mEnglish[39m[38;5;12m [39m[38;5;12m(EN),[39m[38;5;12m [39m[38;5;12mGerman[39m[38;5;12m [39m[38;5;12m(DE),[39m[38;5;12m [39m[38;5;12mCzech[39m[38;5;12m [39m[38;5;12m(CS),[39m[38;5;12m [39m[38;5;12mItalian[39m[38;5;12m [39m[38;5;12m(IT)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mHindi[39m[38;5;12m [39m[38;5;12m(HI)[39m[38;5;12m [39m[38;5;12mspoken[39m[38;5;12m [39m[38;5;12mlanguages.[39m[38;5;12m [39m[38;5;12mLearn[39m[38;5;12m [39m[38;5;12mmore[39m[38;5;12m [39m[38;5;12mabout[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mproject[39m[38;5;12m [39m[38;5;12mat[39m[38;5;12m [39m[38;5;14m[1mLSCP[0m[38;5;14m[1m [0m[38;5;14m[1mwebpage[0m[38;5;12m [39m
|
||||
[38;5;12m(https://iasbs.ac.ir/~ansari/lscp/).[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mArmanPersoNERCorpus[0m[38;5;12m [39m[38;5;12m(https://github.com/HaniehP/PersianNER):[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mdataset[39m[38;5;12m [39m[38;5;12mincludes[39m[38;5;12m [39m[38;5;12m250,015[39m[38;5;12m [39m[38;5;12mtokens[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12m7,682[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mtotal.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mavailable[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12m3[39m[38;5;12m [39m[38;5;12mfolds[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mbe[39m[38;5;12m [39m[38;5;12mused[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mturn[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mtraining[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mtest[39m[38;5;12m [39m[38;5;12msets.[39m[38;5;12m [39m
|
||||
[38;5;12mEach[39m[38;5;12m [39m[38;5;12mfile[39m[38;5;12m [39m[38;5;12mcontains[39m[38;5;12m [39m[38;5;12mone[39m[38;5;12m [39m[38;5;12mtoken,[39m[38;5;12m [39m[38;5;12malong[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mits[39m[38;5;12m [39m[38;5;12mmanually[39m[38;5;12m [39m[38;5;12mannotated[39m[38;5;12m [39m[38;5;12mnamed-entity[39m[38;5;12m [39m[38;5;12mtag,[39m[38;5;12m [39m[38;5;12mper[39m[38;5;12m [39m[38;5;12mline.[39m[38;5;12m [39m[38;5;12mEach[39m[38;5;12m [39m[38;5;12msentence[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mseparated[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mnewline.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mNER[39m[38;5;12m [39m[38;5;12mtags[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mIOB[39m[38;5;12m [39m[38;5;12mformat.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mFarsiYar[0m[38;5;14m[1m [0m[38;5;14m[1mPersianNER[0m[38;5;12m [39m[38;5;12m(https://github.com/Text-Mining/Persian-NER):[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mdataset[39m[38;5;12m [39m[38;5;12mincludes[39m[38;5;12m [39m[38;5;12mabout[39m[38;5;12m [39m[38;5;12m25,000,000[39m[38;5;12m [39m[38;5;12mtokens[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mabout[39m[38;5;12m [39m[38;5;12m1,000,000[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mtotal[39m[38;5;12m [39m[38;5;12mbased[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;14m[1mPersian[0m[38;5;14m[1m [0m[38;5;14m[1mWikipedia[0m[38;5;14m[1m [0m[38;5;14m[1mCorpus[0m[38;5;12m [39m
|
||||
[38;5;12m(https://github.com/Text-Mining/Persian-Wikipedia-Corpus).[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mNER[39m[38;5;12m [39m[38;5;12mtags[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mIOB[39m[38;5;12m [39m[38;5;12mformat.[39m[38;5;12m [39m[38;5;12mMore[39m[38;5;12m [39m[38;5;12mthan[39m[38;5;12m [39m[38;5;12m1000[39m[38;5;12m [39m[38;5;12mvolunteers[39m[38;5;12m [39m[38;5;12mcontributed[39m[38;5;12m [39m[38;5;12mtag[39m[38;5;12m [39m[38;5;12mimprovements[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mdataset[39m[38;5;12m [39m[38;5;12mvia[39m[38;5;12m [39m[38;5;12mweb[39m[38;5;12m [39m[38;5;12mpanel[39m[38;5;12m [39m[38;5;12mor[39m[38;5;12m [39m[38;5;12mandroid[39m[38;5;12m [39m[38;5;12mapp.[39m[38;5;12m [39m[38;5;12mThey[39m[38;5;12m [39m[38;5;12mrelease[39m[38;5;12m [39m
|
||||
[38;5;12mupdated[39m[38;5;12m [39m[38;5;12mtags[39m[38;5;12m [39m[38;5;12mevery[39m[38;5;12m [39m[38;5;12mtwo[39m[38;5;12m [39m[38;5;12mweeks.[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mPERLEX[0m[38;5;12m (http://farsbase.net/PERLEX.html): The first Persian dataset for relation extraction, which is an expert translated version of the “Semeval-2010-Task-8” dataset. Link to the relevant publication.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPersian[0m[38;5;14m[1m [0m[38;5;14m[1mSyntactic[0m[38;5;14m[1m [0m[38;5;14m[1mDependency[0m[38;5;14m[1m [0m[38;5;14m[1mTreebank[0m[38;5;12m [39m[38;5;12m(http://dadegan.ir/catalog/perdt):[39m[38;5;12m [39m[38;5;12mThis[39m[38;5;12m [39m[38;5;12mtreebank[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12msupplied[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mfree[39m[38;5;12m [39m[38;5;12mnoncommercial[39m[38;5;12m [39m[38;5;12muse.[39m[38;5;12m [39m[38;5;12mFor[39m[38;5;12m [39m[38;5;12mcommercial[39m[38;5;12m [39m[38;5;12muses[39m[38;5;12m [39m[38;5;12mfeel[39m[38;5;12m [39m[38;5;12mfree[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mcontact[39m[38;5;12m [39m[38;5;12mus.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mnumber[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mannotated[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m
|
||||
[38;5;12m29,982[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12mincluding[39m[38;5;12m [39m[38;5;12msamples[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12malmost[39m[38;5;12m [39m[38;5;12mall[39m[38;5;12m [39m[38;5;12mverbs[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mvalency[39m[38;5;12m [39m[38;5;12mlexicon.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mBijankhan[0m[38;5;14m[1m [0m[38;5;14m[1mCorpus[0m[38;5;12m [39m[38;5;12m(https://dbrg.ut.ac.ir/بیژن%E2%80%8Cخان/):[39m[38;5;12m [39m[38;5;12mBijankhan[39m[38;5;12m [39m[38;5;12mcorpus[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mtagged[39m[38;5;12m [39m[38;5;12mcorpus[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12msuitable[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mnatural[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12mprocessing[39m[38;5;12m [39m[38;5;12mresearch[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12m(Farsi)[39m[38;5;12m [39m[38;5;12mlanguage.[39m[38;5;12m [39m
|
||||
[38;5;12mThis[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mgathered[39m[38;5;12m [39m[38;5;12mform[39m[38;5;12m [39m[38;5;12mdaily[39m[38;5;12m [39m[38;5;12mnews[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mcommon[39m[38;5;12m [39m[38;5;12mtexts.[39m[38;5;12m [39m[38;5;12mIn[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mall[39m[38;5;12m [39m[38;5;12mdocuments[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12mcategorized[39m[38;5;12m [39m[38;5;12minto[39m[38;5;12m [39m[38;5;12mdifferent[39m[38;5;12m [39m[38;5;12msubjects[39m[38;5;12m [39m[38;5;12msuch[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mpolitical,[39m[38;5;12m [39m[38;5;12mcultural[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mso[39m[38;5;12m [39m[38;5;12mon.[39m[38;5;12m [39m[38;5;12mTotally,[39m[38;5;12m [39m[38;5;12mthere[39m[38;5;12m [39m
|
||||
[38;5;12mare[39m[38;5;12m [39m[38;5;12m4300[39m[38;5;12m [39m[38;5;12mdifferent[39m[38;5;12m [39m[38;5;12msubjects.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mBijankhan[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mcontains[39m[38;5;12m [39m[38;5;12mabout[39m[38;5;12m [39m[38;5;12m2.6[39m[38;5;12m [39m[38;5;12mmillions[39m[38;5;12m [39m[38;5;12mmanually[39m[38;5;12m [39m[38;5;12mtagged[39m[38;5;12m [39m[38;5;12mwords[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mtag[39m[38;5;12m [39m[38;5;12mset[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mcontains[39m[38;5;12m [39m[38;5;12m40[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mPOS[39m[38;5;12m [39m[38;5;12mtags.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mUppsala[0m[38;5;14m[1m [0m[38;5;14m[1mPersian[0m[38;5;14m[1m [0m[38;5;14m[1mCorpus[0m[38;5;14m[1m [0m[38;5;14m[1m(UPC)[0m[38;5;12m [39m[38;5;12m(https://sites.google.com/site/mojganserajicom/home/upc):[39m[38;5;12m [39m[38;5;12mUppsala[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mCorpus[39m[38;5;12m [39m[38;5;12m(UPC)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mlarge,[39m[38;5;12m [39m[38;5;12mfreely[39m[38;5;12m [39m[38;5;12mavailable[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mcorpus.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mcorpus[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mmodified[39m[38;5;12m [39m
|
||||
[38;5;12mversion[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mBijankhan[39m[38;5;12m [39m[38;5;12mcorpus[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12madditional[39m[38;5;12m [39m[38;5;12msentence[39m[38;5;12m [39m[38;5;12msegmentation[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mconsistent[39m[38;5;12m [39m[38;5;12mtokenization[39m[38;5;12m [39m[38;5;12mcontaining[39m[38;5;12m [39m[38;5;12m2,704,028[39m[38;5;12m [39m[38;5;12mtokens[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mannotated[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12m31[39m[38;5;12m [39m[38;5;12mpart-of-speech[39m[38;5;12m [39m[38;5;12mtags.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mpart-of-speech[39m[38;5;12m [39m
|
||||
[38;5;12mtags[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12mlisted[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mexplanations[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;14m[1mthis[0m[38;5;14m[1m [0m[38;5;14m[1mtable[0m[38;5;12m [39m[38;5;12m(https://sites.google.com/site/mojganserajicom/home/upc/Table_tag.pdf).[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mLarge-Scale[0m[38;5;14m[1m [0m[38;5;14m[1mColloquial[0m[38;5;14m[1m [0m[38;5;14m[1mPersian[0m[38;5;12m [39m[38;5;12m(http://hdl.handle.net/11234/1-3195):[39m[38;5;12m [39m[38;5;12mLarge[39m[38;5;12m [39m[38;5;12mScale[39m[38;5;12m [39m[38;5;12mColloquial[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mDataset[39m[38;5;12m [39m[38;5;12m(LSCP)[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mhierarchically[39m[38;5;12m [39m[38;5;12morganized[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12masemantic[39m[38;5;12m [39m[38;5;12mtaxonomy[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mfocuses[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m
|
||||
[38;5;12mmulti-task[39m[38;5;12m [39m[38;5;12minformal[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mlanguage[39m[38;5;12m [39m[38;5;12munderstanding[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mcomprehensive[39m[38;5;12m [39m[38;5;12mproblem.[39m[38;5;12m [39m[38;5;12mLSCP[39m[38;5;12m [39m[38;5;12mincludes[39m[38;5;12m [39m[38;5;12m120M[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12m27M[39m[38;5;12m [39m[38;5;12mcasual[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mtweets[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mits[39m[38;5;12m [39m[38;5;12mdependency[39m[38;5;12m [39m[38;5;12mrelations[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12msyntactic[39m[38;5;12m [39m
|
||||
[38;5;12mannotation,[39m[38;5;12m [39m[38;5;12mPart-of-speech[39m[38;5;12m [39m[38;5;12mtags,[39m[38;5;12m [39m[38;5;12msentiment[39m[38;5;12m [39m[38;5;12mpolarity[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mautomatic[39m[38;5;12m [39m[38;5;12mtranslation[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12moriginal[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mEnglish[39m[38;5;12m [39m[38;5;12m(EN),[39m[38;5;12m [39m[38;5;12mGerman[39m[38;5;12m [39m[38;5;12m(DE),[39m[38;5;12m [39m[38;5;12mCzech[39m[38;5;12m [39m[38;5;12m(CS),[39m[38;5;12m [39m[38;5;12mItalian[39m[38;5;12m [39m[38;5;12m(IT)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mHindi[39m[38;5;12m [39m[38;5;12m(HI)[39m[38;5;12m [39m[38;5;12mspoken[39m[38;5;12m [39m
|
||||
[38;5;12mlanguages.[39m[38;5;12m [39m[38;5;12mLearn[39m[38;5;12m [39m[38;5;12mmore[39m[38;5;12m [39m[38;5;12mabout[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mproject[39m[38;5;12m [39m[38;5;12mat[39m[38;5;12m [39m[38;5;14m[1mLSCP[0m[38;5;14m[1m [0m[38;5;14m[1mwebpage[0m[38;5;12m [39m[38;5;12m(https://iasbs.ac.ir/~ansari/lscp/).[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mArmanPersoNERCorpus[0m[38;5;12m [39m[38;5;12m(https://github.com/HaniehP/PersianNER):[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mdataset[39m[38;5;12m [39m[38;5;12mincludes[39m[38;5;12m [39m[38;5;12m250,015[39m[38;5;12m [39m[38;5;12mtokens[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12m7,682[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mtotal.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mavailable[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12m3[39m[38;5;12m [39m[38;5;12mfolds[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mbe[39m[38;5;12m [39m[38;5;12mused[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mturn[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m
|
||||
[38;5;12mtraining[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mtest[39m[38;5;12m [39m[38;5;12msets.[39m[38;5;12m [39m[38;5;12mEach[39m[38;5;12m [39m[38;5;12mfile[39m[38;5;12m [39m[38;5;12mcontains[39m[38;5;12m [39m[38;5;12mone[39m[38;5;12m [39m[38;5;12mtoken,[39m[38;5;12m [39m[38;5;12malong[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mits[39m[38;5;12m [39m[38;5;12mmanually[39m[38;5;12m [39m[38;5;12mannotated[39m[38;5;12m [39m[38;5;12mnamed-entity[39m[38;5;12m [39m[38;5;12mtag,[39m[38;5;12m [39m[38;5;12mper[39m[38;5;12m [39m[38;5;12mline.[39m[38;5;12m [39m[38;5;12mEach[39m[38;5;12m [39m[38;5;12msentence[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12mseparated[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mnewline.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mNER[39m[38;5;12m [39m[38;5;12mtags[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mIOB[39m[38;5;12m [39m[38;5;12mformat.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mFarsiYar[0m[38;5;14m[1m [0m[38;5;14m[1mPersianNER[0m[38;5;12m [39m[38;5;12m(https://github.com/Text-Mining/Persian-NER):[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mdataset[39m[38;5;12m [39m[38;5;12mincludes[39m[38;5;12m [39m[38;5;12mabout[39m[38;5;12m [39m[38;5;12m25,000,000[39m[38;5;12m [39m[38;5;12mtokens[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mabout[39m[38;5;12m [39m[38;5;12m1,000,000[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mtotal[39m[38;5;12m [39m[38;5;12mbased[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;14m[1mPersian[0m[38;5;14m[1m [0m[38;5;14m[1mWikipedia[0m[38;5;14m[1m [0m
|
||||
[38;5;14m[1mCorpus[0m[38;5;12m [39m[38;5;12m(https://github.com/Text-Mining/Persian-Wikipedia-Corpus).[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mNER[39m[38;5;12m [39m[38;5;12mtags[39m[38;5;12m [39m[38;5;12mare[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mIOB[39m[38;5;12m [39m[38;5;12mformat.[39m[38;5;12m [39m[38;5;12mMore[39m[38;5;12m [39m[38;5;12mthan[39m[38;5;12m [39m[38;5;12m1000[39m[38;5;12m [39m[38;5;12mvolunteers[39m[38;5;12m [39m[38;5;12mcontributed[39m[38;5;12m [39m[38;5;12mtag[39m[38;5;12m [39m[38;5;12mimprovements[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mthis[39m[38;5;12m [39m[38;5;12mdataset[39m[38;5;12m [39m[38;5;12mvia[39m[38;5;12m [39m[38;5;12mweb[39m[38;5;12m [39m[38;5;12mpanel[39m[38;5;12m [39m[38;5;12mor[39m[38;5;12m [39m
|
||||
[38;5;12mandroid[39m[38;5;12m [39m[38;5;12mapp.[39m[38;5;12m [39m[38;5;12mThey[39m[38;5;12m [39m[38;5;12mrelease[39m[38;5;12m [39m[38;5;12mupdated[39m[38;5;12m [39m[38;5;12mtags[39m[38;5;12m [39m[38;5;12mevery[39m[38;5;12m [39m[38;5;12mtwo[39m[38;5;12m [39m[38;5;12mweeks.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPERLEX[0m[38;5;12m [39m[38;5;12m(http://farsbase.net/PERLEX.html):[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mfirst[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mdataset[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mrelation[39m[38;5;12m [39m[38;5;12mextraction,[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mexpert[39m[38;5;12m [39m[38;5;12mtranslated[39m[38;5;12m [39m[38;5;12mversion[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12m“Semeval-2010-Task-8”[39m[38;5;12m [39m[38;5;12mdataset.[39m[38;5;12m [39m[38;5;12mLink[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mrelevant[39m
|
||||
[38;5;12mpublication.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mPersian[0m[38;5;14m[1m [0m[38;5;14m[1mSyntactic[0m[38;5;14m[1m [0m[38;5;14m[1mDependency[0m[38;5;14m[1m [0m[38;5;14m[1mTreebank[0m[38;5;12m [39m[38;5;12m(http://dadegan.ir/catalog/perdt):[39m[38;5;12m [39m[38;5;12mThis[39m[38;5;12m [39m[38;5;12mtreebank[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12msupplied[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mfree[39m[38;5;12m [39m[38;5;12mnoncommercial[39m[38;5;12m [39m[38;5;12muse.[39m[38;5;12m [39m[38;5;12mFor[39m[38;5;12m [39m[38;5;12mcommercial[39m[38;5;12m [39m[38;5;12muses[39m[38;5;12m [39m[38;5;12mfeel[39m[38;5;12m [39m[38;5;12mfree[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mcontact[39m[38;5;12m [39m[38;5;12mus.[39m[38;5;12m [39m[38;5;12mThe[39m[38;5;12m [39m[38;5;12mnumber[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m
|
||||
[38;5;12mannotated[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12m29,982[39m[38;5;12m [39m[38;5;12msentences[39m[38;5;12m [39m[38;5;12mincluding[39m[38;5;12m [39m[38;5;12msamples[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12malmost[39m[38;5;12m [39m[38;5;12mall[39m[38;5;12m [39m[38;5;12mverbs[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mvalency[39m[38;5;12m [39m[38;5;12mlexicon.[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mUppsala Persian Dependency Treebank (UPDT)[0m[38;5;12m (http://stp.lingfil.uu.se/~mojgan/UPDT.html): Dependency-based syntactically annotated corpus.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mHamshahri[0m[38;5;12m [39m[38;5;12m(https://dbrg.ut.ac.ir/hamshahri/):[39m[38;5;12m [39m[38;5;12mHamshahri[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mstandard[39m[38;5;12m [39m[38;5;12mreliable[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mwas[39m[38;5;12m [39m[38;5;12mused[39m[38;5;12m [39m[38;5;12mat[39m[38;5;12m [39m[38;5;12mCross[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mEvaluation[39m[38;5;12m [39m[38;5;12mForum[39m[38;5;12m [39m[38;5;12m(CLEF)[39m[38;5;12m [39m[38;5;12mduring[39m[38;5;12m [39m[38;5;12myears[39m[38;5;12m [39m[38;5;12m2008[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12m2009[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m
|
||||
[38;5;12mevaluation[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12minformation[39m[38;5;12m [39m[38;5;12mretrieval[39m[38;5;12m [39m[38;5;12msystems.[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mHamshahri[0m[38;5;12m [39m[38;5;12m(https://dbrg.ut.ac.ir/hamshahri/):[39m[38;5;12m [39m[38;5;12mHamshahri[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mstandard[39m[38;5;12m [39m[38;5;12mreliable[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12mtext[39m[38;5;12m [39m[38;5;12mcollection[39m[38;5;12m [39m[38;5;12mthat[39m[38;5;12m [39m[38;5;12mwas[39m[38;5;12m [39m[38;5;12mused[39m[38;5;12m [39m[38;5;12mat[39m[38;5;12m [39m[38;5;12mCross[39m[38;5;12m [39m[38;5;12mLanguage[39m[38;5;12m [39m[38;5;12mEvaluation[39m[38;5;12m [39m[38;5;12mForum[39m[38;5;12m [39m[38;5;12m(CLEF)[39m[38;5;12m [39m[38;5;12mduring[39m[38;5;12m [39m[38;5;12myears[39m[38;5;12m [39m[38;5;12m2008[39m[38;5;12m [39m
|
||||
[38;5;12mand[39m[38;5;12m [39m[38;5;12m2009[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mevaluation[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mPersian[39m[38;5;12m [39m[38;5;12minformation[39m[38;5;12m [39m[38;5;12mretrieval[39m[38;5;12m [39m[38;5;12msystems.[39m
|
||||
|
||||
|
||||
[38;2;255;187;0m[4mNLP in Ukrainian[0m
|
||||
@@ -666,7 +677,8 @@
|
||||
[38;2;255;187;0m[4mOther Languages[0m
|
||||
|
||||
[38;5;12m- Russian: [39m[38;5;14m[1mpymorphy2[0m[38;5;12m (https://github.com/kmike/pymorphy2) - a good pos-tagger for Russian[39m
|
||||
[38;5;12m- Asian Languages: Thai, Lao, Chinese, Japanese, and Korean [39m[38;5;14m[1mICU Tokenizer[0m[38;5;12m (https://www.elastic.co/guide/en/elasticsearch/plugins/current/analysis-icu-tokenizer.html) implementation in ElasticSearch[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;12mAsian[39m[38;5;12m [39m[38;5;12mLanguages:[39m[38;5;12m [39m[38;5;12mThai,[39m[38;5;12m [39m[38;5;12mLao,[39m[38;5;12m [39m[38;5;12mChinese,[39m[38;5;12m [39m[38;5;12mJapanese,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mKorean[39m[38;5;12m [39m[38;5;14m[1mICU[0m[38;5;14m[1m [0m[38;5;14m[1mTokenizer[0m[38;5;12m [39m[38;5;12m(https://www.elastic.co/guide/en/elasticsearch/plugins/current/analysis-icu-tokenizer.html)[39m[38;5;12m [39m[38;5;12mimplementation[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m
|
||||
[38;5;12mElasticSearch[39m
|
||||
[38;5;12m- Ancient Languages: [39m[38;5;14m[1mCLTK[0m[38;5;12m (https://github.com/cltk/cltk): The Classical Language Toolkit is a Python library and collection of texts for doing NLP in ancient languages[39m
|
||||
[38;5;12m- Hebrew: [39m[38;5;14m[1mNLPH_Resources[0m[38;5;12m (https://github.com/NLPH/NLPH_Resources) - A collection of papers, corpora and linguistic resources for NLP in Hebrew[39m
|
||||
|
||||
|
||||
Reference in New Issue
Block a user