Ученые-компьютерщики из Принстона разработали новый способ отслеживания происхождения и распространения идей и технологий. Это поможет оценить глобальное влияние научных статей, рассказов, новостей и других источников информации.
Новый метод основан на компьютерных алгоритмах, анализирующих морфемы языка на протяжении периода времени в группе документов - будь то научные статьи по квантовой физике или блоги о политике - и определяющих, какие документы были наиболее влиятельными.
"Благодаря компьютерам и интернету мы теперь в состоянии управлять потоками информации. Например, сегодня можно легко узнать, кто придумал термин "кварк" или найти старые новости о том, где случился первый антивоенный протест 1960-х, - объясняет доцент компьютерных наук в Принстонском университете Дэвид Блей (David Blei). - Мы хотим разобраться, как идеи и информация распространяются в человеческом обществе".
Дэвид Блей надеется, что новая методика поиска может использоваться историками, политологами и другими учеными для исследования процесса возникновения и распространения идей.
Хотя поисковые системы, такие как Google и Bing, помогают людям найти среди океана информации интернета нужные факты, их работа основана на сложном комплексе критериев вроде количества ссылок и трафика посетителей. Подобная схема не в полной мере отражает влияние того или иного документа. В научных изданиях влияние документа оценивается традиционным способом – по количеству цитат в других работах. Однако для других "сборников" материалов, таких как газеты, патентные претензии, сообщения в блогах, нет таких средств измерения влияния.
Вместо того чтобы сосредоточиться на цитатах, ученые разработали специальную статистическую модель. Она позволяет компьютерам анализировать текст документов для оценки изменений самого языка с течением времени. "Влиятельные" идеи создают новые понятия и термины, которые изменяют слова, фразы и суть более поздних работ. Например, слово "лазер" отражается во множестве последующих статей и материалов в самых различных источниках. Соответственно, первая статья, которая ввела в оборот это слово, имела исключительное влияние.
Модель американских ученых может служить альтернативным методом измерения воздействия информации, размещенной на веб-сайтах, в юридических, исторических документах и т.п. В перспективе она даже способна предсказывать "великие идеи" еще до того, как они станут общеизвестными и признанными.
"Благодаря компьютерам и интернету мы теперь в состоянии управлять потоками информации. Например, сегодня можно легко узнать, кто придумал термин "кварк" или найти старые новости о том, где случился первый антивоенный протест 1960-х, - объясняет доцент компьютерных наук в Принстонском университете Дэвид Блей (David Blei). - Мы хотим разобраться, как идеи и информация распространяются в человеческом обществе".
Дэвид Блей надеется, что новая методика поиска может использоваться историками, политологами и другими учеными для исследования процесса возникновения и распространения идей.
Хотя поисковые системы, такие как Google и Bing, помогают людям найти среди океана информации интернета нужные факты, их работа основана на сложном комплексе критериев вроде количества ссылок и трафика посетителей. Подобная схема не в полной мере отражает влияние того или иного документа. В научных изданиях влияние документа оценивается традиционным способом – по количеству цитат в других работах. Однако для других "сборников" материалов, таких как газеты, патентные претензии, сообщения в блогах, нет таких средств измерения влияния.
Вместо того чтобы сосредоточиться на цитатах, ученые разработали специальную статистическую модель. Она позволяет компьютерам анализировать текст документов для оценки изменений самого языка с течением времени. "Влиятельные" идеи создают новые понятия и термины, которые изменяют слова, фразы и суть более поздних работ. Например, слово "лазер" отражается во множестве последующих статей и материалов в самых различных источниках. Соответственно, первая статья, которая ввела в оборот это слово, имела исключительное влияние.
Модель американских ученых может служить альтернативным методом измерения воздействия информации, размещенной на веб-сайтах, в юридических, исторических документах и т.п. В перспективе она даже способна предсказывать "великие идеи" еще до того, как они станут общеизвестными и признанными.
Обсуждения Распространение идей