Полезные запасы SQL-данных?

Кто-нибудь знает какие-либо ресурсы, которые предоставляют хорошие, полезные наборы данных запаса? Например, я загрузил SQL-скрипт, который включает в себя все штаты, города и zip-коды США. Это помогло мне много времени в недавнем приложении, где я хотел бы выполнять поиск по географии. Кто-нибудь из вас знает о других полезных наборах данных, которые доступны для свободного скачивания?

Например:

  • IP-адреса с черным списком
  • Названия колледжей / университетов
  • Названия корпораций / условные обозначения

У кого-нибудь есть рекомендации?

РЕДАКТИРОВАТЬ:

Например, вот где я нашел скрипт MySQL, содержащий все почтовые индексы США и их соответствующую широту / долготу. Кто-нибудь еще нашел аналогичные полезные наборы данных в SQL, которые можно легко импортировать и использовать?

http://www.chrissibert.com/blog/wp-content/uploads/2009/06/zipcodes.7z

EDIT 2:

Чтобы выяснить, о каких типах наборов данных я говорю … Я имею в виду набор данных, которые могут быть сразу полезны для приложений, могут применяться в различных сценариях и обычно представляют собой информацию, которую легко найти для небольших случаев, но сложнее скомпилировать для больших наборов данных. База данных почтового индекса – отличный пример для меня. Нетрудно получить lat / long для одного заданного почтового индекса. Но, это немного больше времени, чтобы получить значения для всех действительных почтовых индексов в США. Эти данные также не полезны ни для одной отрасли, ни для бизнеса, но могут применяться в различных приложениях.

Множество ссылок для открытия наборов данных здесь:

http://readwrite.com/2008/04/09/where_to_find_open_data_on_the/

хотя я сомневаюсь, что любой из них будет генерировать SQL-запросы для вас.

Shadowman , лучше, если вы скажете подробный список того, что хотите.

  • Внесенные в черный список IP-адреса – объявление? Xxx? Мошенничество?
  • Названия колледжей / университетов – Все в мире? Разве это не слишком много?

Вот идея, как выложить список чего-то – вот как я это делаю:

Например, мне нужен список колледжей / университетов в Калифорнии.

  1. Я Google для: colleges california wikipedia . Затем откройте первый найденный элемент ;
  2. С помощью мыши я выбираю все колледжи и университеты оттуда в буфер обмена;
  3. Откройте Excel и вставьте скопированные имена в первую строку + столбец;
  4. Во второй ячейке первой строки записывается шаблонный скрипт, например:

     ="INSERT INTO Colleges (state, name) VALUES ('CA', '" & RC[-1] & "');" 

    Это должно привести к чему-то вроде

     INSERT INTO Colleges (state, name) VALUES ('CA', 'Academy of Art University, San Francisco'); INSERT INTO Colleges (state, name) VALUES ('CA', 'Allied American University, Laguna Hills (Online)'); INSERT INTO Colleges (state, name) VALUES ('CA', 'American Jewish University, Los Angeles'); INSERT INTO Colleges (state, name) VALUES ('CA', 'American Sports University, San Bernardino'); INSERT INTO Colleges (state, name) VALUES ('CA', 'Anaheim University, Anaheim (Online)'); INSERT INTO Colleges (state, name) VALUES ('CA', 'Antioch University, Culver City'); -- etc... 
  5. Затем просто скопируйте сгенерированный скрипт и используйте его для своей базы данных

http://www.data.gov/ имеет множество разных наборов данных, но большинство из них не являются «запасами».

EDIT: Я оставлю свой предыдущий ответ. Если вы хотите конвертировать произвольные CSV в SQL-скрипты для использования базы данных, прочитайте ниже. В противном случае база данных Chinook предлагает отличные образцы данных со сценариями, совместимыми с различными реляционными базами данных .


Я искал образцы базовых SQL-подобных наборов данных, чтобы помочь обучить друга тому, как делать SQL-запросы. Некоторые из размещенных здесь ссылок больше не доступны, поэтому я опубликую то, что я использовал.

В SpatialKey есть некоторые довольно интересные CSV-данные.

Данные CSV можно использовать, если это то, что вам нужно, но мне нужны данные в базе данных SQLite, поэтому я использовал этот удобный онлайн-конвертер CSV-> SQL .

После загрузки SQL я выполнил следующее:

В оболочке:

 sqlite3 <database_file> 

В оболочке SQLite:

 .load <path to SQL script file> 

Символы на складе являются проблематичными, они могут быть разными для каждого места проведения торговли, и в значительной степени все они защищены как охраняемая интеллектуальная собственность объекта или поставщика данных, например Thomson Reuters, Bloomberg, Nasdaq, NYSE.

Если вы ищете данные временных рядов, проверьте Quandl . Самое замечательное в том, что у него множество тонких наборов данных (запасы, экономика, здравоохранение, образование и т. Д.), Но доступно всем одним простым API RESTful. Если программирование – это не ваше дело, тогда есть бесплатный подключаемый модуль Excel, который позволяет легко захватывать данные в вашей электронной таблице.

На сайте документации MySQL есть список загружаемых наборов данных уже в формате SQL, готовый для использования в базе данных.

  1. Загрузите набор данных, например, всемирную базу данных: http://downloads.mysql.com/docs/world_innodb.sql.gz
  2. Измените каталог в папку, которую вы загрузили, например, cd Downloads
  3. Unzip gunzip world_innodb.sql.gz
  4. Войдите в mysql и создайте world базу данных

$ mysql mysql> create database world mysql> quit

  1. Импортируйте содержимое файла mysqldump с помощью cat

cat world_innodb.sql | Мир mysql

Этот набор данных – это идея для учеников, которые хотят практиковать свой SQL.