Google говорит о важности открытого исходного кода и открытых данных в недавнем сообщении в блоге

Технология / Google говорит о важности открытого исходного кода и открытых данных в недавнем сообщении в блоге 3 минуты на чтение

Google



Google как компания всегда поддерживала программное обеспечение и данные с открытым исходным кодом, по крайней мере, в своей позиции. В настоящее время это почти тенденция крупных компаний, поскольку и Google, и Microsoft внесли заметный вклад в сферу открытого исходного кода. « Google также является одним из основных разработчиков программного обеспечения с открытым исходным кодом. Ключевые примеры этого включают Android , операционная система нашего смартфона, Хром , база кода для нашего браузера Chrome (теперь также питая многих конкурентов ), и TensorFlow , наша система машинного обучения. Выпуск Google Губернаторы навсегда изменил облачный хостинг и обеспечил инновации и конкуренцию в облачной индустрии. Google также является крупнейшим разработчиком открытого исходного кода для GitHub , общий репозиторий для разработки программного обеспечения. В 2017 году сотрудники Google внесли более 250 000 изменений в десятки тысяч проектов только на GitHub. '

В большинстве случаев это не совсем щедрость, а скорее получение выгоды от бесплатной разработки, а затем от широкого распространения. Несмотря на это, эти вклады помогли тысячам исследователей и единообразно возглавили разработку программного обеспечения, что следует отметить. Google в недавнем сообщении в блоге подчеркнул свой вклад в развитие открытых данных и программного обеспечения с открытым исходным кодом.



С появлением отслеживания в реальном времени и разработкой автомобилей без водителя, в области компьютерного зрения проводится множество исследований, и Google является одной из компаний, стоящих на передовой в области визуальных технологий.



Наша приверженность открытому исходному коду и открытым данным побудила нас делиться наборами данных, услугами и программным обеспечением со всеми. Например, Google выпустил Набор данных Open Images из 36,5 миллионов изображений, содержащих почти 20 000 категорий объектов, помеченных людьми. С помощью этих данных исследователи компьютерного зрения могут обучать системы распознавания изображений. Точно так же миллионы видео с аннотациями в Ютуб-8М коллекцию можно использовать для обучения распознаванию видео.



- Вариант вещи

Главный экономист Google

Google также использует множество данных, которые могут помочь в исследованиях НЛП и помочь компьютерам лучше понимать человеческую речь. В своем сообщении в блоге Google отметил совместное использование ключевой базы данных, заявив: « Что касается языковой обработки, мы поделились Естественные вопросы база данных, содержащая 307 373 вопросов и ответов, созданных человеком. Мы также сделали доступными Триллион слов , который основан на словах, используемых на общедоступных веб-страницах, и Наблюдатель Ngram , который можно использовать для изучения более 25 миллионов книг в Google Книги . Эти коллекции можно использовать для статистический машинный перевод , распознавание речи, исправление орфографии , обнаружение сущностей, извлечение информации и другие языковые исследования ».



Поисковая система - одна из основных сфер деятельности Google, она получает более 63 000 запросов каждую секунду. Эти данные очень важны для компании, и Google анализирует эти данные для целевой рекламы. Тем не менее, некоторые сведения об общих данных публикуются на портале тенденций Google.

' Google также предлагает Google Trends , бесплатная служба, которая позволяет любому просматривать и загружать совокупную поисковую активность с 2004 года для поиска Google, поиска изображений, поиска новостей, покупок и YouTube. Вы можете получать поисковую информацию по странам, регионам, агломерациям и городам ежемесячно, еженедельно, ежедневно и даже ежечасно. Данные Trends широко используются исследователями в таких различных областях, как медицина и экономика. Согласно Google Scholar, есть более 21000 научных работ которые ссылаются на Trends как на источник данных '.

Зачем работать над проектами с открытым исходным кодом?

Я коротко об этом говорил в начале статьи. Новое программное обеспечение может реализовать отличную идею и внести новшества в пространство, но это не мешает другим реализовать аналогичные идеи, а затем работать над его улучшением. Многие компании научились этому на собственном горьком опыте, например, Windows Phone. Как мы знаем, это был серьезный провал по множеству причин, но большая часть этого была заключена в закрытой среде и контроле над лицензированием. Hardoop и HDFS были версиями MapReduce с открытым исходным кодом, созданными Google, и компания рано осознала важность открытого исходного кода. Подводя итог, можно сказать, что решение сделать IP с открытым исходным кодом является стратегическим.

Google в своем сообщении в блоге углубляется в несколько других причин, заявляя: « Прежде всего, наша основная задача - «систематизировать мировую информацию и сделать ее общедоступной и полезной». Безусловно, один из очевидных способов сделать информацию общедоступной и полезной - это раздать ее. ! '

Они также говорят о том, почему они не могут выпустить некоторые материалы, в которых говорится: Конечно, мы не можем раскрыть все данные, которые используем в нашем бизнесе. Нам необходимо защищать конфиденциальность пользователей, сохранять конфиденциальность для бизнес-клиентов и защищать интеллектуальную собственность Google. Но с учетом таких соображений мы обычно стараемся сделать наши данные как можно более «общедоступными и полезными». '

Теги гугл