Основы SQL для выражений запроса, применяемых в ArcGIS

Основы SQL для выражений запроса, применяемых в ArcGIS

Structured Query Language (SQL) - это стандартный компьютерный язык, содержащий набор определенного синтаксиса и выражений, используемых для доступа и управления данными в базах данных и в других технологиях обработки данных.

Американский национальный институт стандартов (ANSI) определяет стандарт для SQL. Большинство СУБД используют этот стандарт и расширяют его, благодаря чему синтаксис SQL в разных СУБД немного отличается друг от друга.

Выражения запроса в ArcGIS соответствуют стандартным выражениям SQL. Синтаксис SQL, который вы используете в выражении, зависит от источника данных. Каждый источник данных имеет свой собственный вариант SQL, называемый диалектами SQL.

  • Файловые данные, включая файловые базы геоданных, шейп-файлы, виды таблиц в памяти, текстовые файлы, такие как таблицы .dbf , .csv , .txt , .xlsx и сервисы объектов, которые используют стандартизованные запросы, используют диалект ArcGIS SQL, который поддерживает подмножество возможностей SQL.
  • Мобильные базы геоданных, ST_geometry SQLite , GeoPackage и Excel используют диалект SQL SQLite .
  • Базы данных или многопользовательские базы геоданных используют синтаксис SQL базовой СУБД, например Oracle , SQL Server , PostgreSQL , SAP HANA и IBM Db2 , где каждая база данных использует свой собственный немного другой диалект SQL.

При использовании диалоговых окон ArcGIS для построения выражения SQL используется автозаполнение, чтобы помочь вам применить правильный синтаксис для запрашиваемого источника данных. По мере ввода появляется запрос, показывающий имена полей, значения, ключевые слова и операторы, поддерживаемые вашим источником данных.

Подсказка:
  • Если данные в вашем выражении SQL поступают из нескольких источников данных, произойдет следующее:
    • Если источники данных являются как файловые источники, так и СУБД, будет использоваться синтаксис ArcGIS SQL.
    • Если источником данных являются данные на основе файлов, будет использоваться синтаксис ArcGIS SQL.
    • Если источником данных является база данных или многопользовательская база геоданных, ArcGIS передаст выражение SQL в СУБД для разрешения, и вам нужно будет проконсультироваться с документацией для вашей системы управления базой данных, чтобы узнать о синтаксисе конкретного выражения и поддерживаемых типах данных.
    • Выбрать по атрибутам с помощью инструмента геообработки Выбрать в слое по атрибуту .
    • Вкладка Определяющий запрос в диалоговом окне Свойства слоя .
    • Вкладка Фильтры отображения на панели Символы .
    • Создать запрос с помощью панели Создать новые запросы .
    • Экспорт таблиц с помощью инструмента геообработки Таблица в таблицу .
    • Экспорт объектов с помощью инструмента геообработки Класс объектов в класс объектов .
    • Используйте инструмент геообработки Вычислить поле , чтобы создать выражение для выполнения простых или сложных вычислений значений поля.
    • Используйте Выборку для запроса данных для дальнейшего анализа.
    • Используйте инструмент геообработки Создать таблицу запроса , чтобы создать Вид слоя или таблицы.
    • Используйте инструмент геообработки Создать векторный слой , чтобы создать векторный слой.
    • Создайте вид в базе данных или базе геоданных с помощью инструмента геообработки Создать вид базы данных .
    • Используйте инструмент геообработки Присоединить , чтобы добавить несколько входных наборов данных в целевой набор данных.
    • Используйте ProSDK Core.Data.QueryDef.

    Обзор синтаксиса выражения SQL

    Выражение SQL содержит комбинацию одного или нескольких значений, операторов и функций SQL, которые можно использовать для запроса или выбора подмножества объектов и записей таблиц в ArcGIS.

    Все запросы SQL выражаются с помощью ключевого слова SELECT.

    SELECT * FROM формирует первую часть выражения SQL и автоматически предоставляется вам в большинстве диалоговых окон ArcGIS. Например, когда вы составляете запрос, записывая синтаксис SQL, оператор SELECT используется для выбора полей из слоя или таблицы и предоставляется вам.

    Следующая часть выражения SQL, которая приходит после SELECT * FROM <Layer_name> - это предложение WHERE. Предложение WHERE используется для получения записей, соответствующих определенным критериям, и является частью выражения, которое вы должны построить.

    Подсказка:

    Звездочка (*) в выражении SQL используется для запроса всех столбцов.

    Вот базовая форма предложения WHERE SQL-выражения:

    • <Field_name> <Operator> <Value or String>

    Например, STATE_NAME = 'Florida' . Это выражение содержит одно предложение и выбирает все объекты, содержащие слово 'Florida' в поле STATE_NAME .

    Для составных выражений используется следующая форма:

    • <Field_name> <Operator> <Value or String> <Connector> <Field_name> <Operator> <Value or String> .

    Например, STATE_NAME = 'Florida' OR (STATE_NAME = 'South Carolina' AND POP2010 > 15000) . Это составное выражение состоит из нескольких предложений, связанных логическим оператором И или ИЛИ, и выбирает все объекты, содержащие Florida в поле STATE_NAME , и все объекты, которые содержат как South Carolina в поле STATE_NAME , так и имеют значение больше 15000 в поле с именем POP2010 .

    Подсказка:

    По желанию, круглые скобки () могут использоваться для определения порядка операций в составных выражениях.

    Поскольку вы выбираете столбцы в целом, вы не можете ограничить SELECT возвратом только некоторых столбцов в соответствующей таблице, поскольку синтаксис SELECT * жестко запрограммирован. По этой причине ключевые слова, такие как DISTINCT, ORDER BY и GROUP BY, нельзя использовать в выражении SQL в ArcGIS, за исключением случаев использования подзапросов. Подробнее см. в разделе Подзапросы.

    В следующих разделах описаны элементы общих выражений SQL-запросов, используемых в ArcGIS.

    Часто используемые запросы: поиск строк

    Строковые значения в выражениях всегда заключаются в одинарные кавычки, например:

    Строки в выражениях чувствительны к регистру, кроме случаев работы в базах геоданных в Microsoft SQL Server . Чтобы выполнять не чувствительный к регистру поиск в других источниках данных, можно использовать функцию SQL для преобразования всех значений в один регистр. Для источников данных на основе файлов, таких как файловые базы геоданных или шейп-файлы, для задания регистра выборки можно использовать функции UPPER или LOWER. Например, при помощи следующего выражения выбирается штат, имя которого написано как 'Rhode Island' или 'RHODE ISLAND':

    Если строка содержит одинарную кавычку, вам в первую очередь требуется использовать другую одинарную кавычку как символ управляющей последовательности, например:

    При помощи оператора LIKE (вместо оператора = ) строится поиск частей строк. Например, данное выражение выбирает Mississippi и Missouri среди названий штатов США:

    Символ процента (%) означает, что на этом месте может быть что угодно – один символ или сотня, или ни одного. Если вы хотите использовать групповой символ, обозначающий один любой символ, используйте символ подчёркивания (_). Следующий пример показывает выражение для выбора имен Catherine Smith и Katherine Smith:

    Можно также использовать операторы больше (>), меньше (<), больше или равно (>=), меньше или равно (<=), не равно (<>) и BETWEEN, чтобы выбирать строковые значения на основании их сортировки. Например, этот запрос выбирает все города в покрытии, названия которых начинаются с букв от М до Z:

    Строковые функции могут использоваться для форматирования строк. Например функция LEFT возвращает определенное количество символов начиная с левого края строки. Данный запрос возвращает все штаты, начинающиеся на букву A:

    Список поддерживаемых функций вы найдете в документации по своей СУБД.

    Часто используемые выражения: поиск значений NULL

    Вы можете использовать ключевое слово NULL, чтобы отбирать объекты и записи, содержащие пустые поля. Перед ключевым словом NULL всегда стоит IS или IS NOT. Например, чтобы найти города, для которых не была введена численность населения по данным переписи 1996 года, можно использовать следующее выражение:

    Или, чтобы найти все города, для которых указана численность населения, используйте:

    Часто используемые выражения: поиск чисел

    Точка (.) всегда используется в качестве десятичного разделителя, независимо от региональных настроек. В выражениях в качестве разделителя десятичных знаков нельзя использовать запятую.

    Вы можете запрашивать цифровые значения, используя операторы равно (=), не равно (<>), больше (>), меньше (<), больше или равно (>=) и меньше или равно (<=), а также BETWEEN (между), например:

    Числовые функции можно использовать для форматирования чисел. Например функция ROUND округляет до заданного количества десятичных знаков данные в файловой базе геоданных:

    Список поддерживаемых числовых функций см. в документации по СУБД.

    Даты и время

    Общие правила и часто используемые выражения

    В таких источниках данных, как база геоданных, даты хранятся в полях даты–времени. Однако в шейп-файлах это не тек. Поэтому большинство из примеров синтаксиса запроса, представленных ниже, содержит ссылки на время. В некоторых случаях часть запроса, касающаяся времени, может быть без всякого вреда пропущена, когда известно, что поле содержит только даты; в других случаях её необходимо указывать, или запрос вернет синтаксическую ошибку.

    Поиск полей с датой требует внимания к синтаксису, необходимому для источника данных. Если вы создаете запрос в Конструкторе запросов в режиме Условие, правильный синтаксис будет сгенерирован автоматически. Ниже приведен пример запроса, который возвращает все записи после 1 января 2011, включительно, из файловой базы геоданных:

    Примечание:

    Даты хранятся в исходной базе данных относительно 30 декабря 1899 года, 00:00:00. Это действительно для всех источников данных, перечисленных здесь.

    Цель этого подраздела – помочь вам в построении запросов по датам, но не по значениям времени. Когда со значением даты хранится не нулевое значение (например January 12, 1999, 04:00:00), то запрос по дате не возвратит данную запись, поскольку если вы задаете в запросе только дату для поля в формате дата – время, недостающие поля времени заполняются нулями, и выбраны будут только записи, время которых соответствует 12:00:00 полуночи.

    Таблица атрибутов отображает дату и время в удобном для пользователя формате, согласно вашим региональным установкам, а не в формате исходной базы данных. Это подходит для большинства случаев, но имеются и некоторые недостатки:

    • Строка, отображаемая в SQL-запросе, может иметь только небольшое сходство со значением, показанным в таблице, особенно когда в нее входит время. Например время, введенное как 00:00:15, отображается в атрибутивной таблице как 12:00:15 AM с региональными настройками США, а сопоставимый синтаксис запроса Datefield = '1899-12-30 00:00:15'.
    • Атрибутивная таблица не имеет сведений об исходных данных, пока вы не сохраните изменения. Она сначала попытается отформатировать значения в соответствии с ее собственным форматом, затем, после сохранения изменений, она попытается подогнать получившиеся результаты в соответствии с базой данных. По этой причине, вы можете вводить время в шейп-файл, но обнаружите, что оно удаляется при сохранении ваших изменений. Поле будет содержать значение '1899-12-30', которое будет отображаться как 12:00:00 AM или эквивалентно, в зависимости от ваших региональных настроек.
    Синтаксис даты-времени для многопользовательских баз геоданных Oracle

    Имейте в виду, что здесь записи, где время не равно нулю, не будут возвращены.

    Альтернативный формат при запросах к датам в Oracle следующий:

    Второй параметр 'YYYY-MM-DD HH24:MI:SS' описывает используемый при запросах формат. Актуальный запрос выглядит так:

    Вы можете использовать более короткую версию:

    И снова записи, где время не равно нулю, не будут возвращены.

    SQL Server

    Часть запроса hh:mm:ss может быть опущена, когда в записях не установлено время.

    Ниже приведен альтернативный формат:

    IBM Db2

    Часть запроса hh:mm:ss не может быть опущена, даже если время равно 00:00:00.

    PostgreSQL

    Вы должны указать полностью временную метку при использовании запросов типа "равно", в или не будет возвращено никаких записей. Вы можете успешно делать запросы со следующими выражениями, если запрашиваемая таблица содержит записи дат с точными временными метками (2007-05-29 00:00:00 или 2007-05-29 12:14:25):

    При использовании других операторов, таких как больше, меньше, больше или равно, или меньше или равно, вам не нужно указывать время, но это можно сделать для повышения точности. Оба эти выражения работают:

    Файловые базы геоданных, шейп-файлы, покрытия и прочие файловые источники данных

    Файловые базы геоданных поддерживают использование времени в поле даты, поэтому его можно добавить в выражение:

    Шейп-файлы и покрытия не поддерживают использование времени в поле даты.

    Примечание:

    SQL, используемый в файловой базе геоданных, базируется на стандарте SQL-92.

    Известные ограничения

    Построение запросов к датам, находящимся в левой части (первой таблице) соединения, работает только для файловых источников данных, таких как файловые базы геоданных, шейп-файлы и таблицы DBF. Но возможен обходной путь при работе с другими, не файловыми, источниками, такими как многопользовательские данные, как описано ниже.

    Запрос к датам левой части соединения будет выполнен успешно, если использовать ограниченную версию SQL, разработанную для файловых источников данных. Если вы не используете такой источник данных, можете перевести выражение для использования этого формата. Нужно обеспечить, чтобы выражение запроса включало поля из более чем одной присоединенной таблицы. Например, если соединены класс пространственных объектов и таблица (FC1 и Table1), и они поступают из многопользовательской базы геоданных, следующее выражение не будет выполнено или не вернет данные:

    Чтобы запрос был выполнен успешно, можно создать вот такой запрос:

    Так как запрос включает поля из обеих таблиц, будет использована ограниченная версия SQL. В этом выражении Table1.OBJECTID всегда > 0 для записей, которые сопоставлены в процессе создания соединения, поэтому это выражение всегда верно для всех строк, содержащих сопоставления соединения.

    Чтобы быть уверенным, что каждая запись с FC1.date = date '01/12/2001' выбрана, используйте следующий запрос:

    Такой запрос будет выбирать все записи с FC1.date = date '01/12/2001', независимо от того, есть ли сопоставление при соединении для каждой отдельной записи.

    Комбинированные выражения

    Составные запросы могут комбинироваться путем соединения выражений операторами AND (И) и OR (ИЛИ). Вот пример запроса для выборки всех домов с общей площадью более 1500 квадратных футов и гаражом более чем на три машины:

    Когда вы используете оператор OR (ИЛИ), по крайней мере одно из двух разделенных оператором выражений, должно быть верно для выбираемой записи, например:

    Используйте оператор NOT (НЕ) в начале выражения, чтобы найти объекты или записи, не соответствующие условию выражения, например:

    Оператор NOT можно комбинировать с AND и OR. Вот пример запроса, который выбирает все штаты Новой Англии за исключением штата Maine:

    Вычисления

    Вычисления можно включить в запросы с помощью математических операторов +, –, * и /. Можно использовать вычисление между полем и числом, например:

    Вычисления также могут производиться между полями. Например чтобы найти районы с плотностью населения меньшим или равным 25 человек на 1 квадратную милю, можно использовать вот такой запрос:

    Приоритет выражения в скобках

    Выражения выполняются в последовательности, определяемой стандартными правилами. Например, заключённая в круглые скобки часть выражения выполняется раньше, чем часть выражения за скобками.

    Вы можете добавить скобки в режиме Редактирование SQL вручную, или использовать команды Группировать и Разгруппировать в режиме Условие, чтобы добавить или удалить их.

    Подзапросы

    Подзапрос – это запрос, вложенный в другой запрос и поддерживаемый только в базах геоданных. Подзапросы могут использоваться в SQL-выражении для применения предикативных или агрегирующих функций, или для сравнения данных со значениями, хранящимися в другой таблице и т.п. Это может быть сделано с помощью ключевых слов IN или ANY. Например этот запрос выбирает только те страны, которых нет в таблице indep_countries:

    Примечание:

    Шейп-файлы и прочие файловые источники данных, не относящиеся к базам геоданных, не поддерживают подзапросы. Подзапросы, выполняемые на версионных многопользовательских классах объектов и таблицах, не возвращают объекты, которые хранятся в дельта-таблицах. Файловые базы геоданных имеют ограниченную поддержку подзапросов, описанных в данном разделе, в то время, как многопользовательские базы геоданных поддерживают их полностью. Информацию обо всех возможностях подзапросов к многопользовательским базам геоданных смотрите в документации по своей СУБД.

    Этот запрос возвращает объекты, где GDP2006 больше, чем GDP2005 любых объектов, содержащихся в countries (странах):

    Поддержка подзапросов в файловых базах геоданных ограничена следующим:

    • Скалярные подзапросы с операторами сравнения. Скалярный подзапрос возвращает одно значение, например:Для файловых баз геоданных, набор функций AVG, COUNT, MIN, MAX и SUM может использоваться лишь в скалярных подзапросах.
    • Предикат EXISTS, например:

    Операторы

    Ниже приведен полный список операторов, поддерживаемых файловыми базами геоданных, шейп-файлами, покрытиями и прочими файловыми источниками данных. Они также поддерживаются в многопользовательских базах геоданных, хотя для этих источников данных может требоваться иной синтаксис. Кроме нижеперечисленных операторов, многопользовательские базы геоданных поддерживают дополнительные возможности. Более подробную информацию см. в документации по своей СУБД.

    Арифметические операторы

    Для сложения, вычитания, умножения и деления числовых значений можно использовать арифметические операторы.