Corpora – коллекция небольших наборов данных для тестирования прототипов

Corpora - набор небольших наборов данных для ваших проектов
Corpora - набор небольших наборов данных для ваших проектов

Часто при раз­ра­бот­ке и тести­ро­ва­нии при­ло­же­ний или про­то­ти­пов необ­хо­ди­мо исполь­зо­вать дан­ные. Ино­гда хочет­ся сде­лать что-то по-насто­я­ще­му стран­ное и новое.

Corpora – это кол­лек­ция неболь­ших набо­ров дан­ных в json-фай­лах, кото­рые подой­дут как раз для таких слу­ча­ев. Неко­то­рые из набо­ров дан­ных: живот­ные, цве­та, ком­па­нии и еда.

Этот про­ект явля­ет­ся набо­ром ста­ти­че­ских дан­ных, кото­рые явля­ют­ся потен­ци­аль­но полез­ны­ми в созда­нии необыч­ных про­ек­тов. Часто при раз­ра­бот­ке про­ек­та необ­хо­ди­мо полу­чить доступ к боль­шо­му коли­че­ству при­ла­га­тель­ных. Так, от про­ек­та к про­ек­ту попол­нял­ся файл с дан­ны­ми adjs.json.

Все набо­ры дан­ных раз­би­ты по типам, напри­мер: живот­ные, архи­тек­ту­ра, цве­та, ком­па­нии, еда, игры.

Фрагмент раздела проекта Corpora на GitHub.
Фраг­мент раз­де­ла про­ек­та Corpora на GitHub.

Соби­рая такие набо­ры дан­ных, автор про­ек­та Дари­ус Казе­ми (Darius Kazemi) из Босто­на хочет помощь в быст­ром про­то­ти­пи­ро­ва­нии про­ек­тов. Напри­мер, мож­но начать с исполь­зо­ва­ния фай­ла с суще­стви­тель­ны­ми nouns.json, что­бы про­ве­рить рабо­то­спо­соб­ность идеи, после чего дан­ные мож­но заме­нить на более слож­ные набо­ры.

Так­же такие дан­ные могут быть исполь­зо­ва­ны в обра­зо­ва­тель­ных целях. Дари­ус наде­ет­ся, что сту­ден­ты смо­гут отме­тить его про­ект и выбе­рут инте­рес­ные источ­ни­ки дан­ных, что­бы объ­еди­нить­ся для созда­ния про­то­ти­пов.

Так как дан­ные раз­ме­ще­ны на GitHub, то любой жела­ю­щий может исполь­зо­вать их для сво­их про­ек­тов, а так­же сво­бод­но попол­нять эти набо­ры дан­ных.

Набо­ры дан­ных Corpora на GitHub.