Наука о данных - это дисциплина, изучающая определенную информационную базу. Также обсуждается, как эти ресурсы могут быть интерпретированы и представлены для продуктивного использования.
То есть наука о данных - это то, что связано с управлением базами данных, хранящимися в цифровых файлах, из которых можно извлечь много полезной информации в качестве статистических показателей. Это может помочь, например, компании в принятии деловых решений.
Точно так же наука о данных предоставляет инструменты, которые позволяют не только интерпретировать, но и представлять, например, в изображениях доступные данные. Таким образом, у нас есть гистограмма, гистограмма, круговая диаграмма и другие.
Как можно заключить, эта наука является междисциплинарной, поскольку охватывает в основном математику, статистику и информатику.
Наука о данных и типы данных
Также следует отметить, что наука о данных может работать с двумя типами данных:
- Структурированный: Это те, которые организованы, например, таблицы с разными столбцами, каждая из которых имеет свою категорию, например: имя, фамилия, возраст, номер документа, удостоверяющего личность, и т. Д.
- Неструктурированный: Те, которые не соответствуют определенному формату, например, свободно написанный текст. В этом случае вам необходимо интерпретировать контент и извлечь данные, которыми можно управлять.
Принимая во внимание все, что было объяснено, профессионалы, специализирующиеся в области науки о данных, должны не только обладать аналитическими навыками, но и уметь передавать содержание информации, которую они обработали.
Важность науки о данных
Наука о данных важна для компаний или учреждений, которым необходимо работать с большим объемом данных. Таким образом, они могут стать ценной информацией.
Мы можем связать науку о данных с большими данными, которые состоят из разработки механизмов, способных обрабатывать массивные данные, поступающие из различных источников, и управлять ими. Цель состоит в том, чтобы преобразовать их в информацию, которую может интерпретировать человек и которая помогает ему принимать решения.
Эти данные для обработки могут поступать из транзакций между отдельными лицами и организациями (например, банковские операции), повседневных действий людей (например, поиск в Интернете), машин (например, GPS-навигатора сотового телефона, который фиксирует, где находился пользователь) или информации. биометрические (например, отпечатки пальцев).
История науки о данных
Можно сказать, что американский статистик Джон Уайлдер Тьюки был пионером науки о данных в 1960-х годах, подчеркивая важность анализа данных, а не тестирования статистических моделей.
Однако только в 1996 году термин «наука о данных» впервые был использован в названии лекции в лекции под названием «Наука о данных, классификация и родственные методы». Это было сделано в рамках встречи членов «Международной федерации классификационных обществ» (IFCS), состоявшейся в Кобе, Япония.
Еще одна важная веха наступила в 2005 году, когда Национальный совет по науке опубликовал «Долговечные цифровые коллекции данных, способствующие исследованиям и образованию в 21 веке». В этом документе специалисты по обработке данных определяются как компьютерные эксперты, программисты баз данных и программного обеспечения, а также профессионалы из других областей (например, библиотекари и архивисты), которые имеют решающее значение для успешного управления сбором цифровых данных.
Однако эта область все еще находится в стадии разработки.