Updating conversion, creating readmes
This commit is contained in:
@@ -1,12 +1,12 @@
|
||||
[38;5;12m (https://spark.apache.org/)[39m
|
||||
|
||||
[38;5;12m [39m[38;2;255;187;0m[1m[4mAwesome Spark [0m[38;5;14m[1m[4m![0m[38;2;255;187;0m[1m[4mAwesome[0m[38;5;14m[1m[4m (https://cdn.rawgit.com/sindresorhus/awesome/d7305f38d29fed78fa85652e3a63e154dd8e8829/media/badge.svg)[0m[38;2;255;187;0m[1m[4m (https://github.com/sindresorhus/awesome)[0m
|
||||
[38;5;12m [39m[38;2;255;187;0m[1m[4mAwesome Spark [0m[38;5;14m[1m[4m![0m[38;2;255;187;0m[1m[4mAwesome[0m[38;5;14m[1m[4m (https://cdn.rawgit.com/sindresorhus/awesome/d7305f38d29fed78fa85652e3a63e154dd8e8829/media/badge.svg)[0m[38;2;255;187;0m[1m[4m (https://github.com/sindresorhus/awesome)[0m
|
||||
|
||||
[38;5;12mA curated list of awesome [39m[38;5;14m[1mApache Spark[0m[38;5;12m (https://spark.apache.org/) packages and resources.[39m
|
||||
|
||||
[38;5;12m_Apache[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mopen-source[39m[38;5;12m [39m[38;5;12mcluster-computing[39m[38;5;12m [39m[38;5;12mframework.[39m[38;5;12m [39m[38;5;12mOriginally[39m[38;5;12m [39m[38;5;12mdeveloped[39m[38;5;12m [39m[38;5;12mat[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mUniversity[0m[38;5;14m[1m [0m[38;5;14m[1mof[0m[38;5;14m[1m [0m[38;5;14m[1mCalifornia[0m[38;5;12m [39m[38;5;12m(https://www.universityofcalifornia.edu/),[39m[38;5;12m [39m[38;5;14m[1mBerkeley's[0m[38;5;14m[1m [0m[38;5;14m[1mAMPLab[0m[38;5;12m [39m[38;5;12m(https://amplab.cs.berkeley.edu/),[39m[38;5;12m [39m
|
||||
[38;5;12mthe[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mcodebase[39m[38;5;12m [39m[38;5;12mwas[39m[38;5;12m [39m[38;5;12mlater[39m[38;5;12m [39m[38;5;12mdonated[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSoftware[0m[38;5;14m[1m [0m[38;5;14m[1mFoundation[0m[38;5;12m [39m[38;5;12m(https://www.apache.org/),[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12mhas[39m[38;5;12m [39m[38;5;12mmaintained[39m[38;5;12m [39m[38;5;12mit[39m[38;5;12m [39m[38;5;12msince.[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mprovides[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12minterface[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mprogramming[39m[38;5;12m [39m[38;5;12mentire[39m[38;5;12m [39m[38;5;12mclusters[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mimplicit[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m
|
||||
[38;5;12mparallelism[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mfault-tolerance_[39m[38;5;12m [39m[38;5;12m([39m[38;5;14m[1mWikipedia[0m[38;5;14m[1m [0m[38;5;14m[1m2017[0m[38;5;12m [39m[38;5;12m(#wikipedia-2017)).[39m
|
||||
[38;5;12m_Apache[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mopen-source[39m[38;5;12m [39m[38;5;12mcluster-computing[39m[38;5;12m [39m[38;5;12mframework.[39m[38;5;12m [39m[38;5;12mOriginally[39m[38;5;12m [39m[38;5;12mdeveloped[39m[38;5;12m [39m[38;5;12mat[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mUniversity[0m[38;5;14m[1m [0m[38;5;14m[1mof[0m[38;5;14m[1m [0m[38;5;14m[1mCalifornia[0m[38;5;12m [39m[38;5;12m(https://www.universityofcalifornia.edu/),[39m[38;5;12m [39m[38;5;14m[1mBerkeley's[0m[38;5;14m[1m [0m[38;5;14m[1mAMPLab[0m[38;5;12m [39m[38;5;12m(https://amplab.cs.berkeley.edu/),[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mcodebase[39m[38;5;12m [39m[38;5;12mwas[39m[38;5;12m [39m
|
||||
[38;5;12mlater[39m[38;5;12m [39m[38;5;12mdonated[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSoftware[0m[38;5;14m[1m [0m[38;5;14m[1mFoundation[0m[38;5;12m [39m[38;5;12m(https://www.apache.org/),[39m[38;5;12m [39m[38;5;12mwhich[39m[38;5;12m [39m[38;5;12mhas[39m[38;5;12m [39m[38;5;12mmaintained[39m[38;5;12m [39m[38;5;12mit[39m[38;5;12m [39m[38;5;12msince.[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mprovides[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12minterface[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mprogramming[39m[38;5;12m [39m[38;5;12mentire[39m[38;5;12m [39m[38;5;12mclusters[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mimplicit[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mparallelism[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mfault-tolerance_[39m[38;5;12m [39m[38;5;12m([39m[38;5;14m[1mWikipedia[0m[38;5;14m[1m [0m[38;5;14m[1m2017[0m[38;5;12m [39m
|
||||
[38;5;12m(#wikipedia-2017)).[39m
|
||||
|
||||
[38;5;12mUsers of Apache Spark may choose between different the Python, R, Scala and Java programming languages to interface with the Apache Spark APIs.[39m
|
||||
|
||||
@@ -56,12 +56,11 @@
|
||||
[38;2;255;187;0m[4mNotebooks and IDEs[0m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1malmond[0m[38;5;12m (https://almond.sh/) - A scala kernel for [39m[38;5;14m[1mJupyter[0m[38;5;12m (https://jupyter.org/).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mApache Zeppelin[0m[38;5;12m (https://zeppelin.incubator.apache.org/) - Web-based notebook that enables interactive data analytics with plugable backends, integrated plotting, and extensive Spark support out-of-the-box.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mPolynote[0m[38;5;12m [39m[38;5;12m(https://polynote.org/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPolynote:[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mIDE-inspired[39m[38;5;12m [39m[38;5;12mpolyglot[39m[38;5;12m [39m[38;5;12mnotebook.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12msupports[39m[38;5;12m [39m[38;5;12mmixing[39m[38;5;12m [39m[38;5;12mmultiple[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mone[39m[38;5;12m [39m[38;5;12mnotebook,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12msharing[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mbetween[39m[38;5;12m [39m[38;5;12mthem[39m[38;5;12m [39m[38;5;12mseamlessly.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12mencourages[39m[38;5;12m [39m[38;5;12mreproducible[39m[38;5;12m [39m
|
||||
[38;5;12mnotebooks[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mits[39m[38;5;12m [39m[38;5;12mimmutable[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mmodel.[39m[38;5;12m [39m[38;5;12mOriginating[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;14m[1mNetflix[0m[38;5;12m [39m[38;5;12m(https://medium.com/netflix-techblog/open-sourcing-polynote-an-ide-inspired-polyglot-notebook-7f929d3f447).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mSpark Notebook[0m
|
||||
[38;5;12m (https://github.com/andypetrella/spark-notebook) - Scalable and stable Scala and Spark focused notebook bridging the gap between JVM and Data Scientists (incl. extendable, typesafe and reactive charts).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1msparkmagic[0m[38;5;12m [39m[38;5;12m(https://github.com/jupyter-incubator/sparkmagic)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mJupyter[0m[38;5;12m [39m[38;5;12m(https://jupyter.org/)[39m[38;5;12m [39m[38;5;12mmagics[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mkernels[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mworking[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mremote[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mclusters,[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12minteractively[39m[38;5;12m [39m[38;5;12mworking[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mremote[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mclusters[39m[38;5;12m [39m
|
||||
[38;5;12mthrough[39m[38;5;12m [39m[38;5;14m[1mLivy[0m[38;5;12m [39m[38;5;12m(https://github.com/cloudera/livy),[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mJupyter[39m[38;5;12m [39m[38;5;12mnotebooks.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mPolynote[0m[38;5;12m [39m[38;5;12m(https://polynote.org/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPolynote:[39m[38;5;12m [39m[38;5;12man[39m[38;5;12m [39m[38;5;12mIDE-inspired[39m[38;5;12m [39m[38;5;12mpolyglot[39m[38;5;12m [39m[38;5;12mnotebook.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12msupports[39m[38;5;12m [39m[38;5;12mmixing[39m[38;5;12m [39m[38;5;12mmultiple[39m[38;5;12m [39m[38;5;12mlanguages[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mone[39m[38;5;12m [39m[38;5;12mnotebook,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12msharing[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mbetween[39m[38;5;12m [39m[38;5;12mthem[39m[38;5;12m [39m[38;5;12mseamlessly.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12mencourages[39m[38;5;12m [39m[38;5;12mreproducible[39m[38;5;12m [39m[38;5;12mnotebooks[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mits[39m[38;5;12m [39m[38;5;12mimmutable[39m
|
||||
[38;5;12mdata[39m[38;5;12m [39m[38;5;12mmodel.[39m[38;5;12m [39m[38;5;12mOriginating[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;14m[1mNetflix[0m[38;5;12m [39m[38;5;12m(https://medium.com/netflix-techblog/open-sourcing-polynote-an-ide-inspired-polyglot-notebook-7f929d3f447).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mSpark Notebook[0m[38;5;12m (https://github.com/andypetrella/spark-notebook) - Scalable and stable Scala and Spark focused notebook bridging the gap between JVM and Data Scientists (incl. extendable, typesafe and reactive charts).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1msparkmagic[0m[38;5;12m [39m[38;5;12m(https://github.com/jupyter-incubator/sparkmagic)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mJupyter[0m[38;5;12m [39m[38;5;12m(https://jupyter.org/)[39m[38;5;12m [39m[38;5;12mmagics[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mkernels[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mworking[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mremote[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mclusters,[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12minteractively[39m[38;5;12m [39m[38;5;12mworking[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mremote[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mclusters[39m[38;5;12m [39m[38;5;12mthrough[39m[38;5;12m [39m[38;5;14m[1mLivy[0m[38;5;12m [39m
|
||||
[38;5;12m(https://github.com/cloudera/livy),[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mJupyter[39m[38;5;12m [39m[38;5;12mnotebooks.[39m
|
||||
|
||||
[38;2;255;187;0m[4mGeneral Purpose Libraries[0m
|
||||
|
||||
@@ -74,8 +73,8 @@
|
||||
|
||||
[38;2;255;187;0m[4mSQL Data Sources[0m
|
||||
|
||||
[38;5;12mSparkSQL[39m[38;5;12m [39m[38;5;12mhas[39m[38;5;12m [39m[38;5;14m[1mserveral[0m[38;5;14m[1m [0m[38;5;14m[1mbuilt-in[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mSources[0m[38;5;12m [39m[38;5;12m(https://spark.apache.org/docs/latest/sql-data-sources-load-save-functions.html#manually-specifying-options)[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mfiles.[39m[38;5;12m [39m[38;5;12mThese[39m[38;5;12m [39m[38;5;12minclude[39m[38;5;12m [39m[48;5;235m[38;5;249mcsv[49m[39m[38;5;12m,[39m[38;5;12m [39m[48;5;235m[38;5;249mjson[49m[39m[38;5;12m,[39m[38;5;12m [39m[48;5;235m[38;5;249mparquet[49m[39m[38;5;12m,[39m[38;5;12m [39m[48;5;235m[38;5;249morc[49m[39m[38;5;12m,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[48;5;235m[38;5;249mavro[49m[39m
|
||||
[38;5;12m.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12malso[39m[38;5;12m [39m[38;5;12msupports[39m[38;5;12m [39m[38;5;12mJDBC[39m[38;5;12m [39m[38;5;12mdatabases[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mwell[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mApache[39m[38;5;12m [39m[38;5;12mHive.[39m[38;5;12m [39m[38;5;12mAdditional[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12msources[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mbe[39m[38;5;12m [39m[38;5;12madded[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;12mincluding[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mpackages[39m[38;5;12m [39m[38;5;12mlisted[39m[38;5;12m [39m[38;5;12mbelow,[39m[38;5;12m [39m[38;5;12mor[39m[38;5;12m [39m[38;5;12mwriting[39m[38;5;12m [39m[38;5;12myour[39m[38;5;12m [39m[38;5;12mown.[39m
|
||||
[38;5;12mSparkSQL[39m[38;5;12m [39m[38;5;12mhas[39m[38;5;12m [39m[38;5;14m[1mserveral[0m[38;5;14m[1m [0m[38;5;14m[1mbuilt-in[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mSources[0m[38;5;12m [39m[38;5;12m(https://spark.apache.org/docs/latest/sql-data-sources-load-save-functions.html#manually-specifying-options)[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mfiles.[39m[38;5;12m [39m[38;5;12mThese[39m[38;5;12m [39m[38;5;12minclude[39m[38;5;12m [39m[48;5;235m[38;5;249mcsv[49m[39m[38;5;12m,[39m[38;5;12m [39m[48;5;235m[38;5;249mjson[49m[39m[38;5;12m,[39m[38;5;12m [39m[48;5;235m[38;5;249mparquet[49m[39m[38;5;12m,[39m[38;5;12m [39m[48;5;235m[38;5;249morc[49m[39m[38;5;12m,[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[48;5;235m[38;5;249mavro[49m[39m[38;5;12m.[39m[38;5;12m [39m[38;5;12mIt[39m[38;5;12m [39m[38;5;12malso[39m[38;5;12m [39m[38;5;12msupports[39m[38;5;12m [39m[38;5;12mJDBC[39m[38;5;12m [39m
|
||||
[38;5;12mdatabases[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mwell[39m[38;5;12m [39m[38;5;12mas[39m[38;5;12m [39m[38;5;12mApache[39m[38;5;12m [39m[38;5;12mHive.[39m[38;5;12m [39m[38;5;12mAdditional[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12msources[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mbe[39m[38;5;12m [39m[38;5;12madded[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;12mincluding[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mpackages[39m[38;5;12m [39m[38;5;12mlisted[39m[38;5;12m [39m[38;5;12mbelow,[39m[38;5;12m [39m[38;5;12mor[39m[38;5;12m [39m[38;5;12mwriting[39m[38;5;12m [39m[38;5;12myour[39m[38;5;12m [39m[38;5;12mown.[39m
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mSpark CSV[0m[38;5;12m (https://github.com/databricks/spark-csv) - CSV reader and writer (obsolete since Spark 2.0 [39m[38;5;12mSPARK-12833[39m[38;5;14m[1m [0m[38;5;12m (https://issues.apache.org/jira/browse/SPARK-12833)).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mSpark Avro[0m[38;5;12m (https://github.com/databricks/spark-avro) - [39m[38;5;14m[1mApache Avro[0m[38;5;12m (https://avro.apache.org/) reader and writer (obselete since Spark 2.4 [39m[38;5;12mSPARK-24768[39m[38;5;14m[1m [0m[38;5;12m (https://issues.apache.org/jira/browse/SPARK-24768)).[39m
|
||||
@@ -113,8 +112,8 @@
|
||||
|
||||
[38;2;255;187;0m[4mMachine Learning Extension[0m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mClustering4Ever[0m[38;5;12m (https://github.com/Clustering4Ever/Clustering4Ever) Scala and Spark API to benchmark and analyse clustering algorithms on any vectorization you can generate.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mdbscan-on-spark[0m[38;5;12m [39m[38;5;12m(https://github.com/irvingc/dbscan-on-spark)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mAn[39m[38;5;12m [39m[38;5;12mImplementation[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mDBSCAN[39m[38;5;12m [39m[38;5;12mclustering[39m[38;5;12m [39m[38;5;12malgorithm[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mtop[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mApache[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;14m[1mirvingc[0m[38;5;12m [39m[38;5;12m(https://github.com/irvingc)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mbased[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mpaper[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m
|
||||
[38;5;12mHe,[39m[38;5;12m [39m[38;5;12mYaobin,[39m[38;5;12m [39m[38;5;12met[39m[38;5;12m [39m[38;5;12mal.[39m[38;5;12m [39m[38;5;14m[1mMR-DBSCAN:[0m[38;5;14m[1m [0m[38;5;14m[1ma[0m[38;5;14m[1m [0m[38;5;14m[1mscalable[0m[38;5;14m[1m [0m[38;5;14m[1mMapReduce-based[0m[38;5;14m[1m [0m[38;5;14m[1mDBSCAN[0m[38;5;14m[1m [0m[38;5;14m[1malgorithm[0m[38;5;14m[1m [0m[38;5;14m[1mfor[0m[38;5;14m[1m [0m[38;5;14m[1mheavily[0m[38;5;14m[1m [0m[38;5;14m[1mskewed[0m[38;5;14m[1m [0m[38;5;14m[1mdata[0m[38;5;12m [39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mdbscan-on-spark[0m[38;5;12m [39m[38;5;12m(https://github.com/irvingc/dbscan-on-spark)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mAn[39m[38;5;12m [39m[38;5;12mImplementation[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mDBSCAN[39m[38;5;12m [39m[38;5;12mclustering[39m[38;5;12m [39m[38;5;12malgorithm[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mtop[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mApache[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;14m[1mirvingc[0m[38;5;12m [39m[38;5;12m(https://github.com/irvingc)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mbased[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mpaper[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12mHe,[39m[38;5;12m [39m[38;5;12mYaobin,[39m[38;5;12m [39m[38;5;12met[39m[38;5;12m [39m[38;5;12mal.[39m[38;5;12m [39m
|
||||
[38;5;14m[1mMR-DBSCAN:[0m[38;5;14m[1m [0m[38;5;14m[1ma[0m[38;5;14m[1m [0m[38;5;14m[1mscalable[0m[38;5;14m[1m [0m[38;5;14m[1mMapReduce-based[0m[38;5;14m[1m [0m[38;5;14m[1mDBSCAN[0m[38;5;14m[1m [0m[38;5;14m[1malgorithm[0m[38;5;14m[1m [0m[38;5;14m[1mfor[0m[38;5;14m[1m [0m[38;5;14m[1mheavily[0m[38;5;14m[1m [0m[38;5;14m[1mskewed[0m[38;5;14m[1m [0m[38;5;14m[1mdata[0m[38;5;12m [39m
|
||||
[38;5;12m(https://www.researchgate.net/profile/Yaobin_He/publication/260523383_MR-DBSCAN_a_scalable_MapReduce-based_DBSCAN_algorithm_for_heavily_skewed_data/links/0046353a1763ee2bdf000000.pdf).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mApache SystemML[0m[38;5;12m (https://systemml.apache.org/) - Declarative machine learning framework on top of Spark.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mMahout Spark Bindings[0m[38;5;12m (https://mahout.apache.org/users/sparkbindings/home.html) [39m[38;5;12m*[39m[48;2;30;30;40m[38;5;13m[3mstatus unknown[0m[48;2;30;30;40m[38;5;13m[3m*[0m[38;5;12m - linear algebra DSL and optimizer with R-like syntax.[39m
|
||||
@@ -183,43 +182,40 @@
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mLearning Spark, 2nd Edition[0m[38;5;12m (https://www.oreilly.com/library/view/learning-spark-2nd/9781492050032/) - Introduction to Spark API with Spark 3.0 covered. Good source of knowledge about basic concepts.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mAdvanced Analytics with Spark[0m[38;5;12m (http://shop.oreilly.com/product/0636920035091.do) - Useful collection of Spark processing patterns. Accompanying GitHub repository: [39m[38;5;14m[1msryza/aas[0m[38;5;12m (https://github.com/sryza/aas).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mMastering[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;12m [39m[38;5;12m(https://jaceklaskowski.gitbooks.io/mastering-apache-spark/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mInteresting[39m[38;5;12m [39m[38;5;12mcompilation[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mnotes[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;14m[1mJacek[0m[38;5;14m[1m [0m[38;5;14m[1mLaskowski[0m[38;5;12m [39m[38;5;12m(https://github.com/jaceklaskowski).[39m[38;5;12m [39m[38;5;12mFocused[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mdifferent[39m[38;5;12m [39m[38;5;12maspects[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m
|
||||
[38;5;12mSpark[39m[38;5;12m [39m[38;5;12minternals.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mMastering Apache Spark[0m[38;5;12m (https://jaceklaskowski.gitbooks.io/mastering-apache-spark/) - Interesting compilation of notes by [39m[38;5;14m[1mJacek Laskowski[0m[38;5;12m (https://github.com/jaceklaskowski). Focused on different aspects of Spark internals.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mSpark Gotchas[0m[38;5;12m (https://github.com/awesome-spark/spark-gotchas) - Subjective compilation of tips, tricks and common programming mistakes.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1min[0m[38;5;14m[1m [0m[38;5;14m[1mAction[0m[38;5;12m [39m[38;5;12m(https://www.manning.com/books/spark-in-action)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNew[39m[38;5;12m [39m[38;5;12mbook[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mManning's[39m[38;5;12m [39m[38;5;12m"in[39m[38;5;12m [39m[38;5;12maction"[39m[38;5;12m [39m[38;5;12mfamily[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12m+400[39m[38;5;12m [39m[38;5;12mpages.[39m[38;5;12m [39m[38;5;12mStarts[39m[38;5;12m [39m[38;5;12mgently,[39m[38;5;12m [39m[38;5;12mstep-by-step[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mcovers[39m[38;5;12m [39m[38;5;12mlarge[39m[38;5;12m [39m[38;5;12mnumber[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mtopics.[39m[38;5;12m [39m[38;5;12mFree[39m[38;5;12m [39m[38;5;12mexcerpt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m
|
||||
[38;5;12mhow[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;14m[1msetup[0m[38;5;14m[1m [0m[38;5;14m[1mEclipse[0m[38;5;14m[1m [0m[38;5;14m[1mfor[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mapplication[0m[38;5;14m[1m [0m[38;5;14m[1mdevelopment[0m[38;5;12m [39m[38;5;12m(http://freecontent.manning.com/how-to-start-developing-spark-applications-in-eclipse/)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mhow[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mbootstrap[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mnew[39m[38;5;12m [39m[38;5;12mapplication[39m[38;5;12m [39m[38;5;12musing[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mprovided[39m[38;5;12m [39m[38;5;12mMaven[39m[38;5;12m [39m
|
||||
[38;5;12mArchetype.[39m[38;5;12m [39m[38;5;12mYou[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mfind[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12maccompanying[39m[38;5;12m [39m[38;5;12mGitHub[39m[38;5;12m [39m[38;5;12mrepo[39m[38;5;12m [39m[38;5;14m[1mhere[0m[38;5;12m [39m[38;5;12m(https://github.com/spark-in-action/first-edition).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1min[0m[38;5;14m[1m [0m[38;5;14m[1mAction[0m[38;5;12m [39m[38;5;12m(https://www.manning.com/books/spark-in-action)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mNew[39m[38;5;12m [39m[38;5;12mbook[39m[38;5;12m [39m[38;5;12min[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mManning's[39m[38;5;12m [39m[38;5;12m"in[39m[38;5;12m [39m[38;5;12maction"[39m[38;5;12m [39m[38;5;12mfamily[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12m+400[39m[38;5;12m [39m[38;5;12mpages.[39m[38;5;12m [39m[38;5;12mStarts[39m[38;5;12m [39m[38;5;12mgently,[39m[38;5;12m [39m[38;5;12mstep-by-step[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mcovers[39m[38;5;12m [39m[38;5;12mlarge[39m[38;5;12m [39m[38;5;12mnumber[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mtopics.[39m[38;5;12m [39m[38;5;12mFree[39m[38;5;12m [39m[38;5;12mexcerpt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mhow[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;14m[1msetup[0m[38;5;14m[1m [0m[38;5;14m[1mEclipse[0m[38;5;14m[1m [0m[38;5;14m[1mfor[0m[38;5;14m[1m [0m
|
||||
[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mapplication[0m[38;5;14m[1m [0m[38;5;14m[1mdevelopment[0m[38;5;12m [39m[38;5;12m(http://freecontent.manning.com/how-to-start-developing-spark-applications-in-eclipse/)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mhow[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mbootstrap[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mnew[39m[38;5;12m [39m[38;5;12mapplication[39m[38;5;12m [39m[38;5;12musing[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12mprovided[39m[38;5;12m [39m[38;5;12mMaven[39m[38;5;12m [39m[38;5;12mArchetype.[39m[38;5;12m [39m[38;5;12mYou[39m[38;5;12m [39m[38;5;12mcan[39m[38;5;12m [39m[38;5;12mfind[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;12maccompanying[39m[38;5;12m [39m[38;5;12mGitHub[39m[38;5;12m [39m[38;5;12mrepo[39m[38;5;12m [39m
|
||||
[38;5;14m[1mhere[0m[38;5;12m [39m[38;5;12m(https://github.com/spark-in-action/first-edition).[39m
|
||||
|
||||
[38;2;255;187;0m[4mPapers[0m
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mLarge-Scale Intelligent Microservices[0m
|
||||
[38;5;12m (https://arxiv.org/pdf/2009.08044.pdf) - Microsoft paper that presents an Apache Spark-based micro-service orchestration framework that extends database operations to include web service primitives.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mResilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing[0m
|
||||
[38;5;12m (https://people.csail.mit.edu/matei/papers/2012/nsdi_spark.pdf) - Paper introducing a core distributed memory abstraction.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mSpark SQL: Relational Data Processing in Spark[0m
|
||||
[38;5;12m (https://amplab.cs.berkeley.edu/wp-content/uploads/2015/03/SparkSQLSigmod2015.pdf) - Paper introducing relational underpinnings, code generation and Catalyst optimizer.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mStructured[0m[38;5;14m[1m [0m[38;5;14m[1mStreaming:[0m[38;5;14m[1m [0m[38;5;14m[1mA[0m[38;5;14m[1m [0m[38;5;14m[1mDeclarative[0m[38;5;14m[1m [0m[38;5;14m[1mAPI[0m[38;5;14m[1m [0m[38;5;14m[1mfor[0m[38;5;14m[1m [0m[38;5;14m[1mReal-Time[0m[38;5;14m[1m [0m[38;5;14m[1mApplications[0m[38;5;14m[1m [0m[38;5;14m[1min[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;12m [39m[38;5;12m(https://cs.stanford.edu/~matei/papers/2018/sigmod_structured_streaming.pdf)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mStructured[39m[38;5;12m [39m[38;5;12mStreaming[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mnew[39m[38;5;12m [39m[38;5;12mhigh-level[39m[38;5;12m [39m
|
||||
[38;5;12mstreaming[39m[38;5;12m [39m[38;5;12mAPI,[39m[38;5;12m [39m[38;5;12mit[39m[38;5;12m [39m[38;5;12mis[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mdeclarative[39m[38;5;12m [39m[38;5;12mAPI[39m[38;5;12m [39m[38;5;12mbased[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mautomatically[39m[38;5;12m [39m[38;5;12mincrementalizing[39m[38;5;12m [39m[38;5;12ma[39m[38;5;12m [39m[38;5;12mstatic[39m[38;5;12m [39m[38;5;12mrelational[39m[38;5;12m [39m[38;5;12mquery.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mResilient Distributed Datasets: A Fault-Tolerant Abstraction for In-Memory Cluster Computing[0m[38;5;12m (https://people.csail.mit.edu/matei/papers/2012/nsdi_spark.pdf) - Paper introducing a core distributed memory abstraction.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mSpark SQL: Relational Data Processing in Spark[0m[38;5;12m (https://amplab.cs.berkeley.edu/wp-content/uploads/2015/03/SparkSQLSigmod2015.pdf) - Paper introducing relational underpinnings, code generation and Catalyst optimizer.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mStructured Streaming: A Declarative API for Real-Time Applications in Apache Spark[0m
|
||||
[38;5;12m (https://cs.stanford.edu/~matei/papers/2018/sigmod_structured_streaming.pdf) - Structured Streaming is a new high-level streaming API, it is a declarative API based on automatically incrementalizing a static relational query.[39m
|
||||
|
||||
[38;2;255;187;0m[4mMOOCS[0m
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mScience[0m[38;5;14m[1m [0m[38;5;14m[1mand[0m[38;5;14m[1m [0m[38;5;14m[1mEngineering[0m[38;5;14m[1m [0m[38;5;14m[1mwith[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1m(edX[0m[38;5;14m[1m [0m[38;5;14m[1mXSeries)[0m[38;5;12m [39m[38;5;12m(https://www.edx.org/xseries/data-science-engineering-apache-spark)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mSeries[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12mfive[39m[38;5;12m [39m[38;5;12mcourses[39m[38;5;12m [39m[38;5;12m([39m[38;5;14m[1mIntroduction[0m[38;5;14m[1m [0m[38;5;14m[1mto[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;12m [39m
|
||||
[38;5;12m(https://www.edx.org/course/introduction-apache-spark-uc-berkeleyx-cs105x),[39m[38;5;12m [39m[38;5;14m[1mDistributed[0m[38;5;14m[1m [0m[38;5;14m[1mMachine[0m[38;5;14m[1m [0m[38;5;14m[1mLearning[0m[38;5;14m[1m [0m[38;5;14m[1mwith[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;12m [39m[38;5;12m(https://www.edx.org/course/distributed-machine-learning-apache-uc-berkeleyx-cs120x),[39m[38;5;12m [39m
|
||||
[38;5;14m[1mBig[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mAnalysis[0m[38;5;14m[1m [0m[38;5;14m[1mwith[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;12m [39m[38;5;12m(https://www.edx.org/course/big-data-analysis-apache-spark-uc-berkeleyx-cs110x),[39m[38;5;12m [39m[38;5;14m[1mAdvanced[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mfor[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mScience[0m[38;5;14m[1m [0m[38;5;14m[1mand[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mEngineering[0m[38;5;12m [39m
|
||||
[38;5;12m(https://www.edx.org/course/advanced-apache-spark-data-science-data-uc-berkeleyx-cs115x),[39m[38;5;12m [39m[38;5;14m[1mAdvanced[0m[38;5;14m[1m [0m[38;5;14m[1mDistributed[0m[38;5;14m[1m [0m[38;5;14m[1mMachine[0m[38;5;14m[1m [0m[38;5;14m[1mLearning[0m[38;5;14m[1m [0m[38;5;14m[1mwith[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;12m [39m
|
||||
[38;5;12m(https://www.edx.org/course/advanced-distributed-machine-learning-uc-berkeleyx-cs125x))[39m[38;5;12m [39m[38;5;12mcovering[39m[38;5;12m [39m[38;5;12mdifferent[39m[38;5;12m [39m[38;5;12maspects[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12msoftware[39m[38;5;12m [39m[38;5;12mengineering[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mscience.[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12moriented.[39m
|
||||
[38;5;12m(https://www.edx.org/course/introduction-apache-spark-uc-berkeleyx-cs105x),[39m[38;5;12m [39m[38;5;14m[1mDistributed[0m[38;5;14m[1m [0m[38;5;14m[1mMachine[0m[38;5;14m[1m [0m[38;5;14m[1mLearning[0m[38;5;14m[1m [0m[38;5;14m[1mwith[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;12m [39m[38;5;12m(https://www.edx.org/course/distributed-machine-learning-apache-uc-berkeleyx-cs120x),[39m[38;5;12m [39m[38;5;14m[1mBig[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mAnalysis[0m[38;5;14m[1m [0m[38;5;14m[1mwith[0m[38;5;14m[1m [0m
|
||||
[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;12m [39m[38;5;12m(https://www.edx.org/course/big-data-analysis-apache-spark-uc-berkeleyx-cs110x),[39m[38;5;12m [39m[38;5;14m[1mAdvanced[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mfor[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mScience[0m[38;5;14m[1m [0m[38;5;14m[1mand[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mEngineering[0m[38;5;12m [39m
|
||||
[38;5;12m(https://www.edx.org/course/advanced-apache-spark-data-science-data-uc-berkeleyx-cs115x),[39m[38;5;12m [39m[38;5;14m[1mAdvanced[0m[38;5;14m[1m [0m[38;5;14m[1mDistributed[0m[38;5;14m[1m [0m[38;5;14m[1mMachine[0m[38;5;14m[1m [0m[38;5;14m[1mLearning[0m[38;5;14m[1m [0m[38;5;14m[1mwith[0m[38;5;14m[1m [0m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;12m [39m[38;5;12m(https://www.edx.org/course/advanced-distributed-machine-learning-uc-berkeleyx-cs125x))[39m[38;5;12m [39m
|
||||
[38;5;12mcovering[39m[38;5;12m [39m[38;5;12mdifferent[39m[38;5;12m [39m[38;5;12maspects[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12msoftware[39m[38;5;12m [39m[38;5;12mengineering[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdata[39m[38;5;12m [39m[38;5;12mscience.[39m[38;5;12m [39m[38;5;12mPython[39m[38;5;12m [39m[38;5;12moriented.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mBig[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mAnalysis[0m[38;5;14m[1m [0m[38;5;14m[1mwith[0m[38;5;14m[1m [0m[38;5;14m[1mScala[0m[38;5;14m[1m [0m[38;5;14m[1mand[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1m(Coursera)[0m[38;5;12m [39m[38;5;12m(https://www.coursera.org/learn/big-data-analysys)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mScala[39m[38;5;12m [39m[38;5;12moriented[39m[38;5;12m [39m[38;5;12mintroductory[39m[38;5;12m [39m[38;5;12mcourse.[39m[38;5;12m [39m[38;5;12mPart[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;14m[1mFunctional[0m[38;5;14m[1m [0m[38;5;14m[1mProgramming[0m[38;5;14m[1m [0m[38;5;14m[1min[0m[38;5;14m[1m [0m[38;5;14m[1mScala[0m[38;5;14m[1m [0m[38;5;14m[1mSpecialization[0m[38;5;12m [39m
|
||||
[38;5;12m(https://www.coursera.org/specializations/scala).[39m
|
||||
|
||||
[38;2;255;187;0m[4mWorkshops[0m
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mAMP[0m[38;5;14m[1m [0m[38;5;14m[1mCamp[0m[38;5;12m [39m[38;5;12m(http://ampcamp.berkeley.edu)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPeriodical[39m[38;5;12m [39m[38;5;12mtraining[39m[38;5;12m [39m[38;5;12mevent[39m[38;5;12m [39m[38;5;12morganized[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mUC[0m[38;5;14m[1m [0m[38;5;14m[1mBerkeley[0m[38;5;14m[1m [0m[38;5;14m[1mAMPLab[0m[38;5;12m [39m[38;5;12m(https://amplab.cs.berkeley.edu/).[39m[38;5;12m [39m[38;5;12mA[39m[38;5;12m [39m[38;5;12msource[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12museful[39m[38;5;12m [39m[38;5;12mexercise[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mrecorded[39m[38;5;12m [39m[38;5;12mworkshops[39m[38;5;12m [39m[38;5;12mcovering[39m[38;5;12m [39m[38;5;12mdifferent[39m[38;5;12m [39m
|
||||
[38;5;12mtools[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mBerkeley[0m[38;5;14m[1m [0m[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mAnalytics[0m[38;5;14m[1m [0m[38;5;14m[1mStack[0m[38;5;12m [39m[38;5;12m(https://amplab.cs.berkeley.edu/software/).[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mAMP[0m[38;5;14m[1m [0m[38;5;14m[1mCamp[0m[38;5;12m [39m[38;5;12m(http://ampcamp.berkeley.edu)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mPeriodical[39m[38;5;12m [39m[38;5;12mtraining[39m[38;5;12m [39m[38;5;12mevent[39m[38;5;12m [39m[38;5;12morganized[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mUC[0m[38;5;14m[1m [0m[38;5;14m[1mBerkeley[0m[38;5;14m[1m [0m[38;5;14m[1mAMPLab[0m[38;5;12m [39m[38;5;12m(https://amplab.cs.berkeley.edu/).[39m[38;5;12m [39m[38;5;12mA[39m[38;5;12m [39m[38;5;12msource[39m[38;5;12m [39m[38;5;12mof[39m[38;5;12m [39m[38;5;12museful[39m[38;5;12m [39m[38;5;12mexercise[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mrecorded[39m[38;5;12m [39m[38;5;12mworkshops[39m[38;5;12m [39m[38;5;12mcovering[39m[38;5;12m [39m[38;5;12mdifferent[39m[38;5;12m [39m[38;5;12mtools[39m[38;5;12m [39m[38;5;12mfrom[39m[38;5;12m [39m[38;5;12mthe[39m[38;5;12m [39m[38;5;14m[1mBerkeley[0m[38;5;14m[1m [0m
|
||||
[38;5;14m[1mData[0m[38;5;14m[1m [0m[38;5;14m[1mAnalytics[0m[38;5;14m[1m [0m[38;5;14m[1mStack[0m[38;5;12m [39m[38;5;12m(https://amplab.cs.berkeley.edu/software/).[39m
|
||||
|
||||
[38;2;255;187;0m[4mProjects Using Spark[0m
|
||||
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mOryx[0m[38;5;14m[1m [0m[38;5;14m[1m2[0m[38;5;12m [39m[38;5;12m(https://github.com/OryxProject/oryx)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mLambda[0m[38;5;14m[1m [0m[38;5;14m[1marchitecture[0m[38;5;12m [39m[38;5;12m(http://lambda-architecture.net/)[39m[38;5;12m [39m[38;5;12mplatform[39m[38;5;12m [39m[38;5;12mbuilt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mApache[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mKafka[0m[38;5;12m [39m[38;5;12m(http://kafka.apache.org/)[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mspecialization[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mreal-time[39m
|
||||
[38;5;12mlarge[39m[38;5;12m [39m[38;5;12mscale[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m[38;5;12mlearning.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mOryx[0m[38;5;14m[1m [0m[38;5;14m[1m2[0m[38;5;12m [39m[38;5;12m(https://github.com/OryxProject/oryx)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mLambda[0m[38;5;14m[1m [0m[38;5;14m[1marchitecture[0m[38;5;12m [39m[38;5;12m(http://lambda-architecture.net/)[39m[38;5;12m [39m[38;5;12mplatform[39m[38;5;12m [39m[38;5;12mbuilt[39m[38;5;12m [39m[38;5;12mon[39m[38;5;12m [39m[38;5;12mApache[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mKafka[0m[38;5;12m [39m[38;5;12m(http://kafka.apache.org/)[39m[38;5;12m [39m[38;5;12mwith[39m[38;5;12m [39m[38;5;12mspecialization[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mreal-time[39m[38;5;12m [39m[38;5;12mlarge[39m[38;5;12m [39m[38;5;12mscale[39m[38;5;12m [39m[38;5;12mmachine[39m[38;5;12m [39m
|
||||
[38;5;12mlearning.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mPhoton ML[0m[38;5;12m (https://github.com/linkedin/photon-ml) - A machine learning library supporting classical Generalized Mixed Model and Generalized Additive Mixed Effect Model.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mPredictionIO[0m[38;5;12m (https://prediction.io/) - Machine Learning server for developers and data scientists to build and deploy predictive applications in a fraction of the time.[39m
|
||||
[48;5;12m[38;5;11m⟡[49m[39m[38;5;12m [39m[38;5;14m[1mCrossdata[0m[38;5;12m (https://github.com/Stratio/Crossdata) - Data integration platform with extended DataSource API and multi-user environment.[39m
|
||||
@@ -234,10 +230,9 @@
|
||||
|
||||
[38;2;255;187;0m[4mMiscellaneous[0m
|
||||
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mwith[0m[38;5;14m[1m [0m[38;5;14m[1mScala[0m[38;5;14m[1m [0m[38;5;14m[1mGitter[0m[38;5;14m[1m [0m[38;5;14m[1mchannel[0m[38;5;12m [39m[38;5;12m(https://gitter.im/spark-scala/Lobby)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12m"_A[39m[38;5;12m [39m[38;5;12mplace[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12mdiscuss[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mask[39m[38;5;12m [39m[38;5;12mquestions[39m[38;5;12m [39m[38;5;12mabout[39m[38;5;12m [39m[38;5;12musing[39m[38;5;12m [39m[38;5;12mScala[39m[38;5;12m [39m[38;5;12mfor[39m[38;5;12m [39m[38;5;12mSpark[39m[38;5;12m [39m[38;5;12mprogramming_"[39m[38;5;12m [39m[38;5;12mstarted[39m[38;5;12m [39m[38;5;12mby[39m[38;5;12m [39m[38;5;14m[1m@deanwampler[0m[38;5;12m [39m
|
||||
[38;5;12m(https://github.com/deanwampler).[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mUser[0m[38;5;14m[1m [0m[38;5;14m[1mList[0m[38;5;12m [39m[38;5;12m(http://apache-spark-user-list.1001560.n3.nabble.com/)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mDevelopers[0m[38;5;14m[1m [0m[38;5;14m[1mList[0m[38;5;12m [39m[38;5;12m(http://apache-spark-developers-list.1001551.n3.nabble.com/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mMailing[39m[38;5;12m [39m[38;5;12mlists[39m[38;5;12m [39m[38;5;12mdedicated[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12musage[39m[38;5;12m [39m
|
||||
[38;5;12mquestions[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdevelopment[39m[38;5;12m [39m[38;5;12mtopics[39m[38;5;12m [39m[38;5;12mrespectively.[39m
|
||||
[38;5;12m- [39m[38;5;14m[1mSpark with Scala Gitter channel[0m[38;5;12m (https://gitter.im/spark-scala/Lobby) - "_A place to discuss and ask questions about using Scala for Spark programming_" started by [39m[38;5;14m[1m@deanwampler[0m[38;5;12m (https://github.com/deanwampler).[39m
|
||||
[38;5;12m-[39m[38;5;12m [39m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mUser[0m[38;5;14m[1m [0m[38;5;14m[1mList[0m[38;5;12m [39m[38;5;12m(http://apache-spark-user-list.1001560.n3.nabble.com/)[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;14m[1mApache[0m[38;5;14m[1m [0m[38;5;14m[1mSpark[0m[38;5;14m[1m [0m[38;5;14m[1mDevelopers[0m[38;5;14m[1m [0m[38;5;14m[1mList[0m[38;5;12m [39m[38;5;12m(http://apache-spark-developers-list.1001551.n3.nabble.com/)[39m[38;5;12m [39m[38;5;12m-[39m[38;5;12m [39m[38;5;12mMailing[39m[38;5;12m [39m[38;5;12mlists[39m[38;5;12m [39m[38;5;12mdedicated[39m[38;5;12m [39m[38;5;12mto[39m[38;5;12m [39m[38;5;12musage[39m[38;5;12m [39m[38;5;12mquestions[39m[38;5;12m [39m[38;5;12mand[39m[38;5;12m [39m[38;5;12mdevelopment[39m[38;5;12m [39m
|
||||
[38;5;12mtopics[39m[38;5;12m [39m[38;5;12mrespectively.[39m
|
||||
|
||||
[38;2;255;187;0m[4mReferences[0m
|
||||
|
||||
|
||||
Reference in New Issue
Block a user