Какие форматы данных бывают

В то время, когда мы говорим про открытые эти, крайне важно помнить, что открытые эти — это эти машиночитаемые. Эти, каковые пригодны к автоматической машинной обработке, в то время, когда они изначально берутся из некоей базы данных, некоей информационной совокупности, и эта база разрешённых может быть воспроизведена на базе их. Практически, это значит, что те форматы, каковые должны быть опубликованы, должны быть удобны для конечных пользователей, а конечными пользователями являются те программисты, каковые заберут эти сведенья и будут из них что-то делать.

Какие конкретно форматы возможно назвать машиночитаемыми?

Прежде всего, это формат CSV (Comma-Separated Values) — это табличный формат, при котором значения составлены в виде плоской таблицы. Другими словами, это легко таблица из некоего комплекта колонок. Любая колонка в определенном формате, поделённая запятой и с перечислением тех цифр, каковые в том месте имеется. Предположим, в случае если у нас имеется плоская таблица, некий комплект данных, в котором имеется заглавия организаций и количество сотрудников, каковые в том месте числятся, то первая колонка будет именоваться «name», вторая будет именоваться «personnel». В первой будут называния – «ООО Ромашка», «ООО Макрон-15», «ООО котики и Зайчики», и во второй числовые значения: «1», «5», «3» и без того потом. Это — пример публикации в формате CSV. Формат CSV возможно публиковать как посредством особых программных интерфейсов, каковые существуют в огромном количестве баз данных, в большинстве языков программирования, весьма легко сделать данный формат из любого языка, так и посредством вторых средств. В случае если эти у вас имеется изначально в формате Excel, то файл Excel возможно сохранить в формате CSV, в том месте достаточно выбрать опцию «save as» («сохранить как»), и выбрать формат CSV для сохранения. Совершенно верно кроме этого вы имеете возможность сделать посредством свободного ПО, для того чтобы как OpenOffice, LibreOffice, в том месте кроме этого имеется механизм «сохранить как», и выбор формата CSV для сохранения. Это первый, самый простой, самый популярный формат для публикации машиночитаемых данных — CSV.

Второй, более сложный формат именуется XML, eXtensible Markup Language, особый язык разметки, что употребляется для публикации разнообразные структурированной информации. Он употреблялся в течение многих лет по большей части для обмена информацией между различными информационными совокупностями, но точно кроме этого одна из форм обмена — это использование и публикация другой системы легко через обращение к опубликованному файлу. Формат XML употребляется много национальных совокупностей, к примеру, совокупность информации о национальных одолжениях www.bus.gov.ru публикует все данные в формате XML. Совокупность налоговой работы ФИАС публикует все в формате XML. Портал закупок www.zakupki.gov.ru кроме этого публикует данные в формате XML и многие-многие другие. По большей части, базы данных, каковые являются национальными информационными совокупностями, публикуют данные в формате XML. Одно из главных отличий этого формата в том, что к этому описанию имеется, в большинстве случаев, особая схема, которая обрисовывает его структуру. Эта схема именуется XSD (XML Schema definition) и употребляется эта схема чтобы вы осознавали, как с данной информацией возможно трудиться. Формат XML значительно чаще употребляется, в то время, когда у вас нет плоской таблицы, в то время, когда у вас имеется некая иерархия информации, которую вам необходимо представить. Самый несложный пример — предположим, у вас имеется информация об организации, которую вам нужно разместить на некоем сайте. И в данной информации у вас имеется наименование организации, ее реквизиты, ИНН, КПП, но адрес организации у вас представлен не просто в виде адресной строки, но в виде некоего структурированного блока, где указан индекс, город, регион, улица, конкретный дом, номер офиса. Эта информация в структурированном виде возможно положенным объектом. Теоретически она возможно представлена в формате CSV, но на практике положенные объекты, в большинстве случаев, представляются в более сложных форматах, таких как XML. А не редкость так, что не считая одного объекта в описания организации, у вас возможно их множество, и тогда формат XML есть неизбежным злом либо добром, в зависимости от того, как вы обладаете информационными разработками. Исходя из этого вам необходимо помнить, что, в то время, когда эти являются сложными, в то время, когда вы их экспортируете из существующих информационных совокупностей, значительно чаще эти публикуются в формате XML.

Следующий тип данных — это эти, каковые публикуются в формате JSON. JSON — это формат, что появился с распространением интернета, с распространением разработки AJAX, с распространением мобильных приложений. Это особый формат, особый метод публикации данных, что комфортно употребляется при сотрудничестве сайтов между собой через особый интерфейс API, и при применении языка JavaScript, через что эти прекрасно подгружаются. JSON весьма похож на XML в том смысле, что посредством него возможно обрисовать достаточно сложные положенные объекты с одной стороны. Но иначе, он значительно несложнее, он не требует так называемой строго типизации, он не требует того, что именуется детальной схемой, это бессхемный язык, он не требует публикации по аналогии с XML схемы XSD, но одновременно с этим вы имеете возможность опубликовать сложную иерархию. И много данных публикуется как раз в таком виде, но по большей части это негосударственные эти, а разные частные, коммерческие API, они публикуются в таком формате. К примеру, таковой портал открытых данных и таковой софт с открытыми данными как CKAN, применяет формат JSON в качестве стандартного формата для обмена метаданными и разными данными между собственными инсталляциями. И в то время, когда мы создаем портал открытых данных на базе движка CKAN, это значит, мы можем сделать таковой федеративный поиск, и в одну из инсталляций объединить все сведенья из вторых инсталляций, просто-напросто подтягивая их через формат JSON. Это трудится на таковой портал как www.datahub.io – the Open Knowledge Foundation. Это третий формат.

Виды Баз Данных

Похожие статьи:

Понравилась статья? Поделиться с друзьями:
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!:

Adblock
detector