Настройки форматов
Эти настройки генерируются автоматически из source.
allow_special_bool_values_inside_variant
Позволяет распознавать значения Bool внутри типа Variant из специальных текстовых булевых представлений, таких как «on», «off», «enable», «disable» и т. д.
bool_false_representation
Текст, используемый для представления булева значения false в форматах TSV/CSV/Vertical/Pretty.
bool_true_representation
Строковое представление логического значения true в форматах TSV/CSV/Vertical/Pretty.
check_conversion_from_numbers_to_enum
Генерировать исключение при преобразовании Numbers в Enum, если значение отсутствует в Enum.
По умолчанию отключено.
column_names_for_schema_inference
Список названий столбцов, используемых при выводе схемы для форматов, не содержащих названий столбцов. Формат: column1,column2,column3,...
date_time_64_output_format_cut_trailing_zeros_align_to_groups_of_thousands
Динамически удаляет конечные нули в значениях datetime64, чтобы подстроить масштаб вывода под [0, 3, 6], что соответствует 'seconds', 'milliseconds' и 'microseconds'.
date_time_input_format
Позволяет выбрать парсер текстового представления даты и времени.
Настройка не применяется к функциям работы с датой и временем.
Возможные значения:
-
'best_effort'— Включает расширенный режим разбора.ClickHouse может разбирать базовый формат
YYYY-MM-DD HH:MM:SSи все форматы даты и времени ISO 8601. Например,'2018-06-08T01:02:03.000Z'. -
'best_effort_us'— Аналогичноbest_effort(см. различия в parseDateTimeBestEffortUS) -
'basic'— Использовать базовый парсер.ClickHouse может разбирать только базовый формат
YYYY-MM-DD HH:MM:SSилиYYYY-MM-DD. Например,2019-08-20 10:18:56или2019-08-20.
Значение по умолчанию в Cloud: 'best_effort'.
См. также:
date_time_output_format
Позволяет выбирать различные форматы вывода текстового представления даты и времени.
Возможные значения:
-
simple— простой формат вывода.ClickHouse выводит дату и время в формате
YYYY-MM-DD hh:mm:ss. Например,2019-08-20 10:18:56. Вычисление выполняется в часовом поясе типа данных (если он задан) или часовом поясе сервера. -
iso— формат вывода ISO.ClickHouse выводит дату и время в формате ISO 8601
YYYY-MM-DDThh:mm:ssZ. Например,2019-08-20T10:18:56Z. Обратите внимание, что вывод производится в UTC (Zозначает UTC). -
unix_timestamp— формат вывода в виде Unix timestamp.ClickHouse выводит дату и время в формате Unix timestamp. Например,
1566285536.
См. также:
date_time_overflow_behavior
Определяет поведение при преобразовании Date, Date32, DateTime, DateTime64 или целых чисел в Date, Date32, DateTime или DateTime64, если значение не может быть представлено в результирующем типе.
Возможные значения:
ignore— Переполнения молча игнорируются. Результат не определён.throw— Генерировать исключение в случае переполнения.saturate— «Насыщать» результат. Если значение меньше минимального значения, которое может быть представлено целевым типом, результат выбирается как наименьшее представимое значение. Если значение больше максимального значения, которое может быть представлено целевым типом, результат выбирается как наибольшее представимое значение.
Значение по умолчанию: ignore.
errors_output_format
Способ вывода ошибок в текстовом формате.
format_avro_schema_registry_url
Для формата AvroConfluent: URL-адрес Confluent Schema Registry.
format_binary_max_array_size
Максимально допустимый размер массива Array в формате RowBinary. Это предотвращает выделение большого объёма памяти в случае повреждённых данных. Значение 0 означает отсутствие ограничения.
format_binary_max_object_size
Максимально допустимое число путей в одном Object для формата RowBinary типа JSON. Это предотвращает выделение большого объёма памяти в случае повреждённых данных. Значение 0 означает отсутствие ограничения.
format_binary_max_string_size
Максимально допустимый размер значения типа String в формате RowBinary. Предотвращает выделение большого объёма памяти в случае повреждённых данных. Значение 0 означает отсутствие ограничения.
format_capn_proto_enum_comparising_mode
Как сопоставлять перечисления ClickHouse Enum и CapnProto Enum
format_capn_proto_max_message_size
Максимальный размер одного сообщения CapnProto в байтах. Защищает от избыточного выделения памяти при ошибочных или повреждённых данных. Значение по умолчанию — 1 GiB.
format_capn_proto_use_autogenerated_schema
Использовать автоматически сгенерированную схему CapnProto, если параметр format_schema не задан
format_csv_allow_double_quotes
Если установлено значение true, разрешается использовать строки в двойных кавычках.
format_csv_allow_single_quotes
Если установлено в значение true, разрешает строки в одиночных кавычках.
format_csv_delimiter
Символ, используемый в качестве разделителя в данных CSV. Если параметр задаётся строкой, длина строки должна быть равна 1.
format_csv_null_representation
Настраиваемое представление значения NULL в формате CSV
format_custom_escaping_rule
Правило экранирования полей (для формата CustomSeparated)
format_custom_field_delimiter
Разделитель между полями (для формата CustomSeparated)
format_custom_result_after_delimiter
Суффикс, добавляемый после набора результатов (для формата CustomSeparated)
format_custom_result_before_delimiter
Префикс перед результирующим набором (для формата CustomSeparated)
format_custom_row_after_delimiter
Разделитель после поля последнего столбца (для формата CustomSeparated)
format_custom_row_before_delimiter
Разделитель перед полем первого столбца (для формата CustomSeparated)
format_custom_row_between_delimiter
Разделитель между строками (для формата CustomSeparated)
format_display_secrets_in_show_and_select
Включает или отключает отображение секретов в запросах SHOW и SELECT для таблиц, баз данных,
табличных функций и словарей.
Чтобы пользователь мог видеть секреты, у него также должны быть
включена настройка сервера display_secrets_in_show_and_select
и привилегия
displaySecretsInShowAndSelect.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
format_json_object_each_row_column_for_object_name
Имя столбца, которое будет использоваться для хранения и записи имён объектов в формате JSONObjectEachRow.
Тип столбца должен быть String. Если значение не задано, для имён объектов будут использованы имена по умолчанию row_{i}.
format_protobuf_use_autogenerated_schema
Использовать автоматически сгенерированный Protobuf, если format_schema не задан
format_regexp
Регулярное выражение (для формата Regexp)
format_regexp_escaping_rule
Правило экранирования поля (для формата Regexp)
format_regexp_skip_unmatched
Пропускать строки, которые не соответствуют регулярному выражению (для формата Regexp)
format_schema
Этот параметр полезен при работе с форматами, которые требуют определения схемы, такими как Cap'n Proto или Protobuf. Значение зависит от формата.
format_schema_message_name
Определяет имя требуемого сообщения в схеме, указанной в format_schema.
Для сохранения совместимости с устаревшим форматом format_schema (file_name:message_name):
- Если
format_schema_message_nameне указано, имя сообщения определяется по частиmessage_nameустаревшего значенияformat_schema. - Если
format_schema_message_nameуказано при использовании устаревшего формата, будет сгенерирована ошибка.
format_schema_source
Определяет источник format_schema.
Возможные значения:
- 'file' (по умолчанию):
format_schema— это имя файла схемы, расположенного в каталогеformat_schemas. - 'string':
format_schema— это буквальное содержимое схемы. - 'query':
format_schema— это запрос для получения схемы. Когдаformat_schema_sourceустановлен в значение 'query', применяются следующие условия: - Запрос должен возвращать ровно одно значение: одну строку с одним строковым столбцом.
- Результат запроса интерпретируется как содержимое схемы.
- Этот результат кэшируется локально в каталоге
format_schemas. - Вы можете очистить локальный кэш с помощью команды:
SYSTEM DROP FORMAT SCHEMA CACHE FOR Files. - После помещения в кэш идентичные запросы не выполняются повторно для получения схемы до явной очистки кэша.
- В дополнение к локальным кэш-файлам сообщения Protobuf также кэшируются в памяти. Даже после очистки локальных кэш-файлов кэш в памяти необходимо очистить с помощью
SYSTEM DROP FORMAT SCHEMA CACHE [FOR Protobuf], чтобы полностью обновить схему. - Выполните запрос
SYSTEM DROP FORMAT SCHEMA CACHE, чтобы одновременно очистить кэш и для файлов кэша, и для схем сообщений Protobuf.
format_template_resultset
Путь к файлу, содержащему строку формата для результирующего набора (для формата Template)
format_template_resultset_format
Строка формата для результирующего набора (для формата Template)
format_template_row
Путь к файлу, содержащему строку формата для строк (для формата Template)
format_template_row_format
Форматная строка для строк (для формата Template)
format_template_rows_between_delimiter
Разделитель между строками (для формата Template)
format_tsv_null_representation
Пользовательское представление значения NULL в формате TSV
input_format_allow_errors_num
Задаёт максимально допустимое число ошибок при чтении текстовых форматов (CSV, TSV и т. д.).
Значение по умолчанию — 0.
Всегда используйте вместе с input_format_allow_errors_ratio.
Если при чтении строк произошла ошибка, но счётчик ошибок всё ещё меньше input_format_allow_errors_num, ClickHouse игнорирует строку и переходит к следующей.
Если превышены и input_format_allow_errors_num, и input_format_allow_errors_ratio, ClickHouse генерирует исключение.
input_format_allow_errors_ratio
Устанавливает максимальный процент ошибок, допускаемых при чтении текстовых форматов (CSV, TSV и т.д.). Процент ошибок задаётся числом с плавающей запятой в диапазоне от 0 до 1.
Значение по умолчанию — 0.
Всегда используйте его вместе с input_format_allow_errors_num.
Если при чтении строк произошла ошибка, но счётчик ошибок всё ещё меньше input_format_allow_errors_ratio, ClickHouse игнорирует строку и переходит к следующей.
Если и input_format_allow_errors_num, и input_format_allow_errors_ratio превышены, ClickHouse выбрасывает исключение.
input_format_allow_seeks
Разрешает переход к произвольной позиции (seek) при чтении во входных форматах ORC/Parquet/Arrow.
По умолчанию включено.
input_format_arrow_allow_missing_columns
Разрешает пропуск столбцов при чтении входных форматов Arrow
input_format_arrow_case_insensitive_column_matching
Игнорирует регистр при сопоставлении столбцов Arrow со столбцами в ClickHouse.
input_format_arrow_skip_columns_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата Arrow
input_format_avro_allow_missing_fields
Для форматов Avro и AvroConfluent: если поле отсутствует в схеме, вместо ошибки используется значение по умолчанию
input_format_avro_null_as_default
Для форматов Avro/AvroConfluent: вставлять значение по умолчанию в случае null и столбца, не являющегося Nullable
input_format_binary_decode_types_in_binary_format
Читать типы данных в двоичном формате вместо имен типов во входном формате RowBinaryWithNamesAndTypes
input_format_binary_max_type_complexity
Максимальное количество узлов типа при декодировании двоичных типов (не глубина, а общее количество). Map(String, UInt32) = 3 узла. Защищает от вредоносных входных данных. 0 = без ограничений.
input_format_binary_read_json_as_string
Считывает значения типа данных JSON как строковые значения JSON типа String в формате ввода RowBinary.
input_format_bson_skip_fields_with_unsupported_types_in_schema_inference
Пропускать поля с неподдерживаемыми типами при определении схемы для формата BSON.
input_format_capn_proto_skip_fields_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата CapnProto
input_format_csv_allow_cr_end_of_line
Если установлено значение true, \r будет разрешён в конце строки, если за ним не следует
input_format_csv_allow_variable_number_of_columns
Пропускать дополнительные столбцы во входных данных CSV (если файл содержит больше столбцов, чем ожидается) и считать отсутствующие поля во входных данных CSV значениями по умолчанию
input_format_csv_allow_whitespace_or_tab_as_delimiter
Разрешает использовать пробелы и символ табуляции (\t) в качестве разделителя полей в строках CSV.
input_format_csv_arrays_as_nested_csv
При чтении Array из CSV предполагается, что его элементы были сериализованы во вложенном формате CSV, а затем заключены в строку. Пример: "[""Hello"", ""world"", ""42"""" TV""]". Квадратные скобки вокруг массива можно опустить.
input_format_csv_deserialize_separate_columns_into_tuple
Если установлено значение true, отдельные столбцы в формате CSV могут быть десериализованы в столбец типа Tuple.
input_format_csv_detect_header
Автоматически определять строку заголовка с именами и типами в CSV-данных
input_format_csv_empty_as_default
Обрабатывать пустые поля во входных данных CSV как значения по умолчанию.
input_format_csv_enum_as_number
Обрабатывать значения enum, вставляемые в форматах CSV, как индексы enum
input_format_csv_skip_first_lines
Пропускает указанное количество строк в начале входных данных в формате CSV
input_format_csv_skip_trailing_empty_lines
Пропускать пустые строки в конце файла в формате CSV
input_format_csv_trim_whitespaces
Удаляет пробелы и символы табуляции (\t) в начале и в конце строк CSV
input_format_csv_try_infer_numbers_from_strings
Если включено, при определении схемы ClickHouse будет пытаться распознавать числа в строковых полях. Это может быть полезно, если данные CSV содержат заключённые в кавычки числа типа UInt64.
По умолчанию отключено.
input_format_csv_try_infer_strings_from_quoted_tuples
Интерпретировать заключённые в кавычки кортежи во входных данных как значения типа String.
input_format_csv_use_best_effort_in_schema_inference
Использовать дополнительные эвристики и приёмы для определения схемы в формате CSV
input_format_csv_use_default_on_bad_values
Разрешает устанавливать для столбца значение по умолчанию, если десериализация поля CSV завершилась неудачно из‑за некорректного значения
input_format_custom_allow_variable_number_of_columns
Игнорировать лишние столбцы во входных данных CustomSeparated (если в файле больше столбцов, чем ожидается) и интерпретировать отсутствующие поля во входных данных CustomSeparated как значения по умолчанию.
input_format_custom_detect_header
Автоматически распознавать заголовок с именами и типами в формате CustomSeparated
input_format_custom_skip_trailing_empty_lines
Пропускать пустые строки в конце в формате CustomSeparated
input_format_defaults_for_omitted_fields
При выполнении запросов INSERT эта настройка заменяет пропущенные входные значения столбцов значениями по умолчанию соответствующих столбцов. Эта опция применяется к форматам JSONEachRow (и другим JSON-форматам), CSV, TabSeparated, TSKV, Parquet, Arrow, Avro, ORC, Native, а также к форматам с суффиксами WithNames/WithNamesAndTypes.
Когда эта опция включена, с сервера на клиент отправляются расширенные метаданные таблицы. Это требует дополнительных вычислительных ресурсов на сервере и может снизить производительность.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_force_null_for_omitted_fields
Принудительно инициализировать пропущенные поля значением NULL
input_format_hive_text_allow_variable_number_of_columns
Игнорировать дополнительные столбцы во входных данных формата Hive Text (если в файле больше столбцов, чем ожидается) и трактовать отсутствующие поля во входных данных Hive Text как значения по умолчанию.
input_format_hive_text_collection_items_delimiter
Разделитель между элементами коллекции (array или map) в текстовом файле Hive
input_format_hive_text_fields_delimiter
Разделитель между полями в текстовых файлах Hive
input_format_hive_text_map_keys_delimiter
Разделитель между парой ключ/значение в карте (map) в текстовом файле Hive
input_format_import_nested_json
Включает или отключает возможность вставки JSON-данных со вложенными объектами.
Поддерживаемые форматы:
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
См. также:
- Использование вложенных структур с форматом
JSONEachRow.
input_format_ipv4_default_on_conversion_error
При десериализации IPv4 будут использоваться значения по умолчанию вместо генерации исключения при ошибке преобразования.
Отключено по умолчанию.
input_format_ipv6_default_on_conversion_error
При десериализации значений IPv6 при ошибке преобразования вместо выбрасывания исключения будут использоваться значения по умолчанию.
По умолчанию параметр отключен.
input_format_json_compact_allow_variable_number_of_columns
Разрешает переменное число столбцов в строках во входных форматах JSONCompact/JSONCompactEachRow. Игнорирует лишние столбцы в строках, где столбцов больше, чем ожидается, и рассматривает отсутствующие столбцы как значения по умолчанию.
По умолчанию отключено.
input_format_json_defaults_for_missing_elements_in_named_tuple
Вставляет значения по умолчанию для отсутствующих элементов в JSON-объекте при разборе именованного кортежа.
Эта настройка работает только при включённой настройке input_format_json_named_tuples_as_objects.
По умолчанию включена.
input_format_json_empty_as_default
Когда этот параметр включён, пустые поля во входных данных JSON заменяются значениями по умолчанию. Для сложных выражений по умолчанию также должен быть включён input_format_defaults_for_omitted_fields.
Возможные значения:
- 0 — выключено.
- 1 — включено.
input_format_json_ignore_unknown_keys_in_named_tuple
Игнорирует неизвестные ключи в JSON-объекте для именованных кортежей.
Включено по умолчанию.
input_format_json_ignore_unnecessary_fields
Игнорировать ненужные поля и не разбирать их. Включение этой настройки может привести к тому, что исключения не будут генерироваться для JSON-строк с некорректным форматом или с дублирующимися полями.
input_format_json_infer_array_of_dynamic_from_array_of_different_types
Если параметр включен, при определении схемы ClickHouse будет использовать тип Array(Dynamic) для JSON-массивов, содержащих значения разных типов данных.
Пример:
Включён по умолчанию.
input_format_json_infer_incomplete_types_as_strings
Разрешает использовать тип String для JSON-ключей, которые содержат только Null/{}/[] в выборке данных при выводе схемы.
В JSON-форматах любое значение может быть считано как String, что позволяет избежать ошибок вида Cannot determine type for column 'column_name' by first 25000 rows of data, most likely this column contains only Nulls or empty Arrays/Maps при выводе схемы
за счёт использования типа String для ключей с неизвестными типами.
Пример:
Результат:
Включено по умолчанию.
input_format_json_map_as_array_of_tuples
Десериализует столбцы типа Map как JSON-массивы кортежей.
По умолчанию отключено.
input_format_json_max_depth
Максимальная глубина вложенности поля в JSON. Это не жёсткое ограничение, его не требуется строго соблюдать.
input_format_json_named_tuples_as_objects
Разбирать столбцы именованных кортежей как JSON-объекты.
Включено по умолчанию.
input_format_json_read_arrays_as_strings
Разрешает разбирать массивы JSON как строки во входных JSON-форматах.
Пример:
Результат:
По умолчанию включено.
input_format_json_read_bools_as_numbers
Позволяет интерпретировать логические значения как числа во входных форматах JSON.
Включено по умолчанию.
input_format_json_read_bools_as_strings
Разрешает разбор логических значений, представленных в виде строк, во входных форматах JSON.
Включен по умолчанию.
input_format_json_read_numbers_as_strings
Разрешает интерпретировать числа как строки во входных форматах JSON.
Включено по умолчанию.
input_format_json_read_objects_as_strings
Позволяет парсить JSON-объекты как строки в JSON-форматах ввода.
Пример:
Результат:
Включён по умолчанию.
input_format_json_throw_on_bad_escape_sequence
Выбрасывает исключение, если JSON-строка содержит некорректную последовательность экранирования во входных JSON-форматах. Если параметр отключён, такие последовательности останутся в данных без изменений.
По умолчанию включён.
input_format_json_try_infer_named_tuples_from_objects
Если параметр включен, при определении схемы ClickHouse попытается вывести именованный Tuple из JSON-объектов. Полученный именованный Tuple будет содержать все элементы из всех соответствующих JSON-объектов из примера данных.
Пример:
Результат:
Включено по умолчанию.
input_format_json_try_infer_numbers_from_strings
Если параметр включён, при определении схемы ClickHouse будет пытаться выводить числовые типы из строковых полей. Это может быть полезно, если JSON-данные содержат заключённые в кавычки числа типа UInt64.
По умолчанию параметр отключён.
input_format_json_use_string_type_for_ambiguous_paths_in_named_tuples_inference_from_objects
Использовать тип String вместо генерации исключения в случае неоднозначных путей в JSON-объектах при определении типов именованных кортежей
input_format_json_validate_types_from_metadata
Для форматов ввода JSON/JSONCompact/JSONColumnsWithMetadata, если для этого параметра установлено значение 1, типы из метаданных во входных данных будут сравниваться с типами соответствующих столбцов таблицы.
Параметр включен по умолчанию.
input_format_max_block_size_bytes
Ограничивает размер блоков, формируемых при разборе данных во входных форматах, в байтах. Используется во входных форматах, основанных на строках, когда блок формируется на стороне ClickHouse. 0 означает отсутствие ограничения по размеру в байтах.
input_format_max_bytes_to_read_for_schema_inference
Максимальный объём данных в байтах, считываемый для автоматического определения схемы.
input_format_max_rows_to_read_for_schema_inference
Максимальное количество строк данных, считываемых для автоматического определения схемы.
input_format_msgpack_number_of_columns
Количество столбцов во вставляемых данных в формате MsgPack. Используется для автоматического определения схемы на основе данных.
input_format_mysql_dump_map_column_names
Сопоставлять столбцы таблицы в дампе MySQL со столбцами таблицы ClickHouse по именам
input_format_mysql_dump_table_name
Имя таблицы в дампе MySQL, из которой считывать данные
input_format_native_allow_types_conversion
Разрешает преобразование типов данных во входном формате Native
input_format_native_decode_types_in_binary_format
Считывать типы данных в двоичном формате вместо их названий во входном формате Native
input_format_null_as_default
Включает или отключает инициализацию полей NULL значениями по умолчанию, если тип данных этих полей не является Nullable.
Если тип столбца не Nullable и эта настройка отключена, вставка NULL приводит к исключению. Если тип столбца Nullable, то значения NULL вставляются как есть, независимо от этой настройки.
Эта настройка применима к большинству форматов ввода.
Для сложных выражений по умолчанию необходимо также включить input_format_defaults_for_omitted_fields.
Возможные значения:
- 0 — Вставка
NULLв столбец с типом, не поддерживающим Nullable, приводит к исключению. - 1 — Поля
NULLинициализируются значениями столбца по умолчанию.
input_format_orc_allow_missing_columns
Разрешает отсутствие столбцов при чтении входных форматов ORC
input_format_orc_case_insensitive_column_matching
Игнорировать регистр при сопоставлении столбцов ORC со столбцами ClickHouse.
input_format_orc_dictionary_as_low_cardinality
При чтении файлов ORC трактовать закодированные словарём столбцы формата ORC как столбцы типа LowCardinality.
input_format_orc_filter_push_down
При чтении файлов ORC можно пропускать целые страйпы или группы строк на основе выражений WHERE/PREWHERE, статистик min/max или фильтра Блума из метаданных ORC.
input_format_orc_reader_time_zone_name
Имя часового пояса, используемого ридером строк ORC; по умолчанию используется GMT.
input_format_orc_row_batch_size
Размер пакета строк при чтении страйпов ORC.
input_format_orc_skip_columns_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при автоматическом определении схемы для формата ORC
input_format_orc_use_fast_decoder
Использовать более быструю реализацию декодера ORC.
input_format_parallel_parsing
Включает или отключает параллельный разбор форматов данных с сохранением порядка. Поддерживается только для форматов TabSeparated (TSV), TSKV, CSV и JSONEachRow.
Возможные значения:
- 1 — включено.
- 0 — отключено.
input_format_parquet_allow_geoparquet_parser
Использовать парсер геостолбцов для преобразования Array(UInt8) в типы Point/Linestring/Polygon/MultiLineString/MultiPolygon.
input_format_parquet_allow_missing_columns
Разрешает отсутствие столбцов при чтении данных в формате Parquet
input_format_parquet_bloom_filter_push_down
При чтении файлов Parquet целые группы строк пропускаются на основе выражений WHERE и bloom-фильтра из метаданных Parquet.
input_format_parquet_case_insensitive_column_matching
Игнорировать регистр при сопоставлении столбцов Parquet со столбцами CH.
input_format_parquet_enable_json_parsing
При чтении файлов Parquet интерпретировать JSON-столбцы как столбцы JSON ClickHouse.
input_format_parquet_enable_row_group_prefetch
Включает предварительную выборку групп строк при разборе формата Parquet. В настоящее время предварительная выборка возможна только при однопоточном разборе.
input_format_parquet_filter_push_down
При чтении файлов Parquet позволяет пропускать целые группы строк на основе выражений WHERE/PREWHERE и min/max статистики в метаданных Parquet.
input_format_parquet_local_file_min_bytes_for_seek
Минимальное количество байт при локальном чтении файла, начиная с которого выполняется seek вместо чтения с пропуском данных во входном формате Parquet
input_format_parquet_local_time_as_utc
Определяет тип данных, используемый при выводе схемы для временных меток Parquet с isAdjustedToUTC=false. Если true: DateTime64(..., 'UTC'), если false: DateTime64(...). Ни один из вариантов не является полностью корректным, поскольку в ClickHouse нет типа данных для локального времени по настенным часам. На первый взгляд парадоксально, но значение true, скорее всего, является менее некорректным вариантом, потому что форматирование временной метки с 'UTC' как String приведёт к отображению корректного локального времени.
input_format_parquet_max_block_size
Максимальный размер блока для ридера Parquet.
input_format_parquet_memory_high_watermark
Приблизительное ограничение по объёму памяти для считывателя Parquet v3. Ограничивает количество групп строк или столбцов, которые можно читать параллельно. При чтении нескольких файлов в одном запросе лимит применяется к общему использованию памяти всеми этими файлами.
input_format_parquet_memory_low_watermark
Включает более агрессивное упреждающее чтение, если использование памяти ниже заданного порога. Может быть полезно, например, когда по сети нужно прочитать много небольших bloom-фильтров.
input_format_parquet_page_filter_push_down
Пропускать страницы, используя минимальные и максимальные значения из индекса столбца.
input_format_parquet_prefer_block_bytes
Средний размер блока в байтах, формируемого Parquet-ридером
input_format_parquet_preserve_order
Избегает изменения порядка строк при чтении файлов Parquet. Не рекомендуется, поскольку порядок строк обычно не гарантируется, и другие части конвейера обработки запроса могут его изменить. Вместо этого используйте ORDER BY _row_number.
input_format_parquet_skip_columns_with_unsupported_types_in_schema_inference
Пропускать столбцы с неподдерживаемыми типами при определении схемы для формата Parquet
input_format_parquet_use_native_reader_v3
Использовать ридер Parquet v3.
input_format_parquet_use_offset_index
Небольшое изменение в способе чтения страниц из файла Parquet при отсутствии фильтрации страниц.
input_format_parquet_verify_checksums
Проверяет контрольные суммы страниц при чтении файлов Parquet.
input_format_protobuf_flatten_google_wrappers
Включает использование обёрток Google для обычных невложенных столбцов, например google.protobuf.StringValue 'str' для столбца типа String 'str'. Для столбцов типа Nullable пустые обёртки интерпретируются как значения по умолчанию, а отсутствующие — как NULL.
input_format_protobuf_oneof_presence
Указывает, какое поле protobuf oneof было найдено, путем установки значения перечисления в специальном столбце.
input_format_protobuf_skip_fields_with_unsupported_types_in_schema_inference
Пропускать поля с неподдерживаемыми типами при определении схемы для формата Protobuf
input_format_record_errors_file_path
Путь к файлу для записи ошибок, возникающих при чтении текстовых форматов (CSV, TSV).
input_format_skip_unknown_fields
Включает или отключает пропуск вставки дополнительных данных.
При записи данных ClickHouse вызывает исключение, если входные данные содержат столбцы, которых нет в целевой таблице. Если пропуск включён, ClickHouse не вставляет дополнительные данные и не вызывает исключение.
Поддерживаемые форматы:
- JSONEachRow (и другие форматы JSON)
- BSONEachRow (и другие форматы JSON)
- TSKV
- Все форматы с суффиксами WithNames/WithNamesAndTypes
- MySQLDump
- Native
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_try_infer_dates
Если параметр включён, ClickHouse будет пытаться определять тип Date по строковым полям при выводе схемы для текстовых форматов. Если все значения столбца во входных данных были успешно разобраны как даты, результирующий тип будет Date, если хотя бы одно значение не было разобрано как дата, результирующий тип будет String.
Включено по умолчанию.
input_format_try_infer_datetimes
Если параметр включен, ClickHouse будет пытаться определять тип DateTime64 на основе строковых полей при автоматическом выводе схемы для текстовых форматов. Если все значения столбца во входных данных были успешно разобраны как дата-время, результирующим типом будет DateTime64; если хотя бы одно значение не удалось разобрать как дату-время, результирующим типом будет String.
По умолчанию включено.
input_format_try_infer_datetimes_only_datetime64
Когда input_format_try_infer_datetimes включён, следует определять только типы DateTime64, но не DateTime.
input_format_try_infer_exponent_floats
Пытаться выводить тип вещественных чисел для значений в экспоненциальной нотации при выводе схемы в текстовых форматах (кроме JSON, где числа с экспонентой всегда распознаются как вещественные)
input_format_try_infer_integers
Если параметр включен, ClickHouse попытается определять целые числа вместо чисел с плавающей запятой при выводе схемы для текстовых форматов. Если все числа в столбце входных данных являются целыми, результирующим типом будет Int64, если хотя бы одно число является числом с плавающей запятой, результирующим типом будет Float64.
Включено по умолчанию.
input_format_try_infer_variants
Если параметр включен, ClickHouse будет пытаться определять тип Variant при автоопределении схемы для текстовых форматов, когда для элементов столбца/массива существует более одного возможного типа.
Возможные значения:
- 0 — Отключено.
- 1 — Включено.
input_format_tsv_allow_variable_number_of_columns
Игнорирует лишние столбцы во входных данных TSV (если в файле больше столбцов, чем ожидается) и рассматривает отсутствующие поля во входных данных TSV как значения по умолчанию.
input_format_tsv_crlf_end_of_line
Если установлено значение true, функция file будет читать файлы в формате TSV с окончаниями строк \r\n вместо \n.
input_format_tsv_detect_header
Автоматически определять заголовок с именами и типами в формате TSV
input_format_tsv_empty_as_default
Обрабатывать пустые поля во входных данных TSV как значения по умолчанию.
input_format_tsv_enum_as_number
Обрабатывать вставляемые значения типа Enum в форматах TSV как числовые индексы перечисления.
input_format_tsv_skip_first_lines
Пропускает указанное количество строк в начале входных данных в формате TSV
input_format_tsv_skip_trailing_empty_lines
Пропускать пустые строки в конце файла в формате TSV
input_format_tsv_use_best_effort_in_schema_inference
Использовать различные приемы и эвристики для определения схемы в формате TSV
input_format_values_accurate_types_of_literals
Для формата Values: при разборе и интерпретации выражений с использованием Template проверять фактический тип литерала, чтобы избежать возможного переполнения и потери точности.
input_format_values_deduce_templates_of_expressions
Для формата Values: если поле не удалось разобрать потоковым парсером, запустить SQL-парсер, определить шаблон SQL-выражения, попытаться разобрать все строки с использованием этого шаблона, а затем интерпретировать выражение для всех строк.
input_format_values_interpret_expressions
Для формата Values: если поле не удаётся разобрать потоковым парсером, запускается SQL‑парсер, и выполняется попытка интерпретировать его как SQL‑выражение.
input_format_with_names_use_header
Включает или отключает проверку порядка столбцов при вставке данных.
Для повышения производительности вставки рекомендуется отключить эту проверку, если вы уверены, что порядок столбцов во входных данных совпадает с порядком столбцов в целевой таблице.
Поддерживаемые форматы:
- CSVWithNames
- CSVWithNamesAndTypes
- TabSeparatedWithNames
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNames
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNames
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNames
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNames
- CustomSeparatedWithNamesAndTypes
Возможные значения:
- 0 — отключено.
- 1 — включено.
input_format_with_types_use_header
Определяет, следует ли проверять, совпадают ли типы данных во входных данных с типами данных целевой таблицы.
Поддерживаемые форматы:
- CSVWithNamesAndTypes
- TabSeparatedWithNamesAndTypes
- JSONCompactEachRowWithNamesAndTypes
- JSONCompactStringsEachRowWithNamesAndTypes
- RowBinaryWithNamesAndTypes
- CustomSeparatedWithNamesAndTypes
Возможные значения:
- 0 — отключено.
- 1 — включено.
insert_distributed_one_random_shard
Включает или отключает вставку данных в случайный сегмент таблицы Distributed, когда не задан ключ распределения.
По умолчанию при вставке данных в таблицу Distributed с более чем одним сегментом сервер ClickHouse отклоняет любой запрос на вставку, если не указан ключ распределения. Если insert_distributed_one_random_shard = 1, вставки разрешены, и данные распределяются случайным образом между всеми сегментами.
Возможные значения:
- 0 — Вставка отклоняется, если есть несколько сегментов и ключ распределения не задан.
- 1 — Вставка выполняется случайным образом между всеми доступными сегментами, если ключ распределения не задан.
interval_output_format
Позволяет выбирать различные форматы текстового вывода типов интервалов.
Возможные значения:
-
kusto- формат вывода в стиле KQL.ClickHouse выводит интервалы в формате KQL. Например,
toIntervalDay(2)будет отформатирован как2.00:00:00. Обратите внимание, что для интервальных типов переменной длины (то естьIntervalMonthиIntervalYear) учитывается среднее количество секунд на один интервал. -
numeric- числовой формат вывода.ClickHouse выводит интервалы как их базовое числовое представление. Например,
toIntervalDay(2)будет отформатирован как2.
См. также:
into_outfile_create_parent_directories
Автоматически создавать родительские каталоги при использовании INTO OUTFILE, если они ещё не созданы.
json_type_escape_dots_in_keys
Если параметр включен, точки в ключах JSON будут экранироваться при разборе.
output_format_arrow_compression_method
Метод сжатия для формата вывода Arrow. Поддерживаемые кодеки: lz4_frame, zstd, none (без сжатия).
output_format_arrow_fixed_string_as_fixed_byte_array
Использовать тип Arrow FIXED_SIZE_BINARY вместо типа Binary для столбцов FixedString.
output_format_arrow_low_cardinality_as_dictionary
Включает вывод типа LowCardinality в виде типа Arrow Dictionary
output_format_arrow_string_as_string
Использовать тип Arrow String вместо Binary для столбцов типа String
output_format_arrow_use_64_bit_indexes_for_dictionary
Всегда использовать 64-битные целые числа для индексов словаря в формате Arrow
output_format_arrow_use_signed_indexes_for_dictionary
Использует знаковые целые числа для индексов словаря в формате Arrow
output_format_avro_codec
Кодек сжатия, используемый при выводе. Возможные значения: 'null', 'deflate', 'snappy', 'zstd'.
output_format_avro_rows_in_file
Максимальное количество строк в файле (если позволяет хранилище)
output_format_avro_string_column_pattern
Для формата Avro: регулярное выражение (regexp) для столбцов типа String, которые следует сериализовать как AVRO string.
output_format_avro_sync_interval
Интервал синхронизации в байтах.
output_format_binary_encode_types_in_binary_format
Записывать типы данных в двоичном формате вместо названий типов в формате вывода RowBinaryWithNamesAndTypes
output_format_binary_write_json_as_string
Записывает значения типа данных JSON как строковые значения типа String в формате вывода RowBinary.
output_format_bson_string_as_string
Использовать BSON-тип String вместо Binary для строковых столбцов.
output_format_compression_level
Уровень сжатия по умолчанию при сжатии результата запроса. Настройка применяется, когда запрос SELECT содержит INTO OUTFILE или при записи в табличные функции file, url, hdfs, s3 или azureBlobStorage.
Возможные значения: от 1 до 22
output_format_compression_zstd_window_log
Может использоваться, когда метод сжатия вывода — zstd. Если значение больше 0, этот параметр явно задаёт размер окна сжатия (степень двойки) и включает режим long-range для сжатия zstd. Это может помочь достичь лучшего коэффициента сжатия.
Возможные значения: неотрицательные числа. Обратите внимание, что если значение слишком маленькое или слишком большое, zstdlib выбросит исключение. Типичные значения — от 20 (размер окна = 1MB) до 30 (размер окна = 1GB).
output_format_csv_crlf_end_of_line
Если установлено в true, конец строки в формате CSV будет \r\n вместо \n.
output_format_csv_serialize_tuple_into_separate_columns
Если установлено значение true, то кортежи в формате CSV сериализуются как отдельные столбцы (то есть их вложенность в кортеже не сохраняется).
output_format_decimal_trailing_zeros
Выводить конечные нули при выводе значений типа Decimal. Например, 1.230000 вместо 1.23.
По умолчанию отключено.
output_format_json_array_of_rows
Включает вывод всех строк в виде JSON-массива в формате JSONEachRow.
Возможные значения:
- 1 — ClickHouse выводит все строки как массив, каждая строка в формате
JSONEachRow. - 0 — ClickHouse выводит каждую строку отдельно в формате
JSONEachRow.
Пример запроса с включённой настройкой
Запрос:
Результат:
Пример запроса с отключенной настройкой
Запрос:
Результат:
output_format_json_escape_forward_slashes
Управляет экранированием символов прямой косой черты (/) для строковых значений в формате вывода JSON. Предназначено для совместимости с JavaScript. Не путайте с символами обратной косой черты (), которые всегда экранируются.
По умолчанию параметр включён.
output_format_json_map_as_array_of_tuples
Сериализует столбцы типа Map как JSON-массивы кортежей.
По умолчанию отключено.
output_format_json_named_tuples_as_objects
Сериализует столбцы именованных кортежей как JSON-объекты.
Включено по умолчанию.
output_format_json_pretty_print
Этот параметр задаёт, как вложенные структуры, такие как Tuples, Maps и Arrays, отображаются внутри массива data при использовании формата вывода JSON.
Например, вместо вывода:
Результат будет иметь следующий формат:
Включено по умолчанию.
output_format_json_quote_64bit_floats
Управляет заключением 64-битных чисел с плавающей запятой в кавычки при их выводе в форматах JSON*.
По умолчанию отключено.
output_format_json_quote_64bit_integers
Определяет, заключаются ли 64-битные и более крупные целые числа (такие как UInt64 или Int128) в кавычки при выводе в формате JSON.
По умолчанию такие целые числа заключаются в кавычки. Такое поведение совместимо с большинством реализаций JavaScript.
Возможные значения:
- 0 — целые числа выводятся без кавычек.
- 1 — целые числа заключаются в кавычки.
output_format_json_quote_decimals
Управляет заключением десятичных чисел в кавычки в форматах вывода JSON.
По умолчанию отключено.
output_format_json_quote_denormals
Включает вывод значений +nan, -nan, +inf, -inf в формате JSON.
Возможные значения:
- 0 — отключено.
- 1 — включено.
Пример
Рассмотрим следующую таблицу account_orders:
Когда output_format_json_quote_denormals = 0, запрос возвращает значения null в выходных данных:
Когда output_format_json_quote_denormals = 1, запрос вернёт:
output_format_json_skip_null_value_in_named_tuples
Пропускает пары ключ–значение со значением null при сериализации столбцов именованных кортежей в объекты JSON. Применяется только если output_format_json_named_tuples_as_objects имеет значение true.
output_format_json_validate_utf8
Управляет проверкой последовательностей UTF-8 в форматах вывода JSON, не влияет на форматы JSON/JSONCompact/JSONColumnsWithMetadata — они всегда выполняют проверку UTF-8.
По умолчанию отключено.
output_format_markdown_escape_special_characters
При включении выполняет экранирование специальных символов в Markdown.
CommonMark определяет следующие специальные символы, которые могут экранироваться этим параметром:
Возможные значения:
- 0 — отключено.
- 1 — включено.
output_format_msgpack_uuid_representation
Определяет способ вывода UUID в формате MsgPack.
output_format_native_encode_types_in_binary_format
Записывает типы данных в двоичном формате вместо их имен в формате вывода Native
output_format_native_use_flattened_dynamic_and_json_serialization
Записывать данные столбцов JSON и Dynamic в развёрнутом формате (все типы/пути в виде отдельных подстолбцов).
output_format_native_write_json_as_string
Записывает данные столбца типа JSON как столбец типа String, содержащий JSON-строки, вместо стандартной нативной сериализации JSON.
output_format_orc_compression_block_size
Размер блока сжатия в байтах для выходного формата ORC.
output_format_orc_compression_method
Метод сжатия для формата вывода ORC. Поддерживаемые кодеки сжатия: lz4, snappy, zlib, zstd, none (без сжатия).
output_format_orc_dictionary_key_size_threshold
Для строкового столбца в формате вывода ORC, если число уникальных значений превышает эту долю от общего числа строк с ненулевыми (не-NULL) значениями, кодирование с использованием словаря отключается. В противном случае кодирование с использованием словаря остается включенным.
output_format_orc_row_index_stride
Целевой интервал индексации строк в выходном формате ORC
output_format_orc_string_as_string
Использовать тип ORC String вместо Binary для строковых столбцов
output_format_orc_writer_time_zone_name
Имя часового пояса для модуля записи ORC; по умолчанию используется часовой пояс GMT.
output_format_parallel_formatting
Включает или отключает параллельное форматирование данных. Поддерживается только для форматов TSV, TSKV, CSV и JSONEachRow.
Возможные значения:
- 1 — Включено.
- 0 — Отключено.
output_format_parquet_batch_size
Проверять размер страницы после указанного количества строк. Рассмотрите возможность уменьшить это значение, если у вас есть столбцы со средним размером значений более нескольких КБ.
output_format_parquet_bloom_filter_bits_per_value
Приблизительное количество бит, используемых для каждого уникального значения в bloom-фильтрах Parquet. Оценочные вероятности ложноположительных срабатываний:
- 6 бит — 10%
- 10.5 бит — 1%
- 16.9 бит — 0.1%
- 26.4 бит — 0.01%
- 41 бит — 0.001%
output_format_parquet_bloom_filter_flush_threshold_bytes
Где в файле Parquet размещать bloom-фильтры. Bloom-фильтры будут записываться группами примерно такого размера. В частности:
- если значение равно 0, bloom-фильтры каждой группы строк записываются сразу после группы строк,
- если значение больше суммарного размера всех bloom-фильтров, bloom-фильтры для всех групп строк будут накапливаться в памяти, а затем записываться вместе ближе к концу файла,
- в противном случае bloom-фильтры будут накапливаться в памяти и записываться, когда их общий размер превысит это значение.
output_format_parquet_compliant_nested_types
В схеме файла Parquet использовать имя element вместо item для элементов списка. Это исторический артефакт реализации библиотеки Arrow. В целом повышает совместимость, за исключением, возможно, некоторых старых версий Arrow.
output_format_parquet_compression_method
Метод сжатия выходного формата Parquet. Поддерживаемые кодеки: snappy, lz4, brotli, zstd, gzip, none — без сжатия.
output_format_parquet_data_page_size
Целевой размер страницы в байтах до сжатия.
output_format_parquet_date_as_uint16
Записывать значения типа Date в виде обычных 16-битных чисел (считываются обратно как UInt16) вместо преобразования в 32-битный тип DATE формата Parquet (считывается обратно как Date32).
output_format_parquet_datetime_as_uint32
Записывать значения DateTime как «сырые» unix‑таймстемпы (читаются как UInt32), вместо преобразования в миллисекунды (читаются как DateTime64(3)).
output_format_parquet_enum_as_byte_array
Записывает значения Enum, используя физический тип Parquet BYTE_ARRAY и логический тип ENUM
output_format_parquet_fixed_string_as_fixed_byte_array
Использовать тип данных Parquet FIXED_LEN_BYTE_ARRAY вместо Binary для столбцов FixedString.
output_format_parquet_geometadata
Позволяет записывать информацию о столбцах с геоданными в метаданные Parquet и кодировать эти столбцы в формате WKB.
output_format_parquet_max_dictionary_size
Если размер словаря превышает указанное количество байт, используется кодирование без словаря. Установите значение 0, чтобы отключить кодирование со словарём.
output_format_parquet_parallel_encoding
Выполнять кодирование Parquet в нескольких потоках. Требует включённой настройки output_format_parquet_use_custom_encoder.
output_format_parquet_row_group_size
Целевой размер группы по числу строк.
output_format_parquet_row_group_size_bytes
Целевой размер группы строк в байтах до сжатия.
output_format_parquet_string_as_string
Использовать тип данных Parquet String вместо Binary для строковых столбцов.
output_format_parquet_use_custom_encoder
Использовать более быструю реализацию кодировщика Parquet.
output_format_parquet_version
Версия формата Parquet при выводе данных. Поддерживаемые версии: 1.0, 2.4, 2.6 и 2.latest (по умолчанию).
output_format_parquet_write_bloom_filter
Записывает фильтры Блума в файлы Parquet. Требует, чтобы параметр output_format_parquet_use_custom_encoder был установлен в true.
output_format_parquet_write_checksums
Записывать контрольные суммы CRC32 в заголовки страниц формата Parquet.
output_format_parquet_write_page_index
Записывает индекс столбца и индекс смещения (т. е. статистику по каждой странице данных, которая может использоваться для фильтрации при чтении) в файлы Parquet.
output_format_pretty_color
Использовать управляющие последовательности ANSI в форматах Pretty. 0 — отключено, 1 — включено, auto — включено, если вывод осуществляется в терминал.
output_format_pretty_display_footer_column_names
Отображать имена столбцов в нижнем колонтитуле, если в таблице много строк.
Возможные значения:
- 0 — имена столбцов не отображаются в нижнем колонтитуле.
- 1 — имена столбцов отображаются в нижнем колонтитуле, если число строк больше либо равно пороговому значению, заданному настройкой output_format_pretty_display_footer_column_names_min_rows (по умолчанию — 50).
Пример
Запрос:
Результат:
output_format_pretty_display_footer_column_names_min_rows
Задает минимальное количество строк, при котором будет отображаться футер с именами столбцов, если включена настройка output_format_pretty_display_footer_column_names.
output_format_pretty_fallback_to_vertical
Если параметр включён и таблица широкая, но короткая, формат Pretty выведет её так же, как формат Vertical.
См. output_format_pretty_fallback_to_vertical_max_rows_per_chunk и output_format_pretty_fallback_to_vertical_min_table_width для подробной настройки этого поведения.
output_format_pretty_fallback_to_vertical_max_rows_per_chunk
Переход к формату Vertical (см. output_format_pretty_fallback_to_vertical) будет выполняться только в том случае, если количество строк во фрагменте не превышает указанное значение.
output_format_pretty_fallback_to_vertical_min_columns
Переключение на формат Vertical (см. output_format_pretty_fallback_to_vertical) будет выполняться только в том случае, если количество столбцов превышает указанное значение.
output_format_pretty_fallback_to_vertical_min_table_width
Автоматическое переключение на формат Vertical (см. output_format_pretty_fallback_to_vertical) будет выполнено только в том случае, если сумма длин столбцов в таблице не менее указанного значения или если хотя бы одно значение содержит символ новой строки.
output_format_pretty_glue_chunks
Если данные, выводимые в форматах Pretty, поступили в нескольких фрагментах, даже с задержкой, но следующий фрагмент имеет те же ширины столбцов, что и предыдущий, используйте управляющие последовательности ANSI, чтобы вернуться на предыдущую строку и перерисовать нижнюю строку предыдущего фрагмента, продолжив его данными нового фрагмента. Это делает результат более приятным визуально.
0 — отключено, 1 — включено, 'auto' — включено, если вывод в терминал.
output_format_pretty_grid_charset
Набор символов для отображения границ таблицы. Доступные наборы символов: ASCII, UTF-8 (по умолчанию).
output_format_pretty_highlight_digit_groups
Если параметр включен и вывод осуществляется в терминал, каждая цифра в разрядах тысяч, миллионов и т.д. подчеркивается.
output_format_pretty_highlight_trailing_spaces
Если параметр включен и вывод идет в терминал, подсвечивает пробелы в конце строк серым цветом и подчеркивает их.
output_format_pretty_max_column_name_width_cut_to
Если имя столбца слишком длинное, оно будет усечено до этой длины.
Имя столбца будет усечено, если его длина больше, чем output_format_pretty_max_column_name_width_cut_to плюс output_format_pretty_max_column_name_width_min_chars_to_cut.
output_format_pretty_max_column_name_width_min_chars_to_cut
Минимальное количество символов, на которое сокращается имя столбца, если оно слишком длинное.
Имя столбца будет сокращено, если его длина превышает сумму output_format_pretty_max_column_name_width_cut_to и output_format_pretty_max_column_name_width_min_chars_to_cut.
output_format_pretty_max_column_pad_width
Максимальная ширина, до которой дополняются все значения в столбце в форматах Pretty.
output_format_pretty_max_rows
Предельное количество строк для форматов Pretty.
output_format_pretty_max_value_width
Максимальная ширина значения при отображении в форматах Pretty. Если значение больше — оно будет обрезано. Значение 0 означает, что обрезка не выполняется.
output_format_pretty_max_value_width_apply_for_single_value
Обрезать значения (см. настройку output_format_pretty_max_value_width) только в том случае, когда в блоке более одного значения. В противном случае выводить значение полностью, что полезно для запроса SHOW CREATE TABLE.
output_format_pretty_multiline_fields
При включении форматы Pretty будут отображать многострочные поля внутри ячейки таблицы, чтобы сохранить границы таблицы. При отключении они будут выводиться как есть, что может деформировать таблицу (одним из преимуществ отключения является упрощение копирования и вставки многострочных значений).
output_format_pretty_named_tuples_as_json
Определяет, выводятся ли именованные кортежи в формате Pretty как красиво отформатированные JSON-объекты.
output_format_pretty_row_numbers
Добавляет порядковые номера перед каждой строкой в формате вывода Pretty
output_format_pretty_single_large_number_tip_threshold
Выводит подсказку с числом в человекочитаемом виде справа от таблицы, если блок содержит одно число, которое превышает это значение (за исключением 0).
output_format_pretty_squash_consecutive_ms
Ожидать следующий блок до указанного количества миллисекунд и объединить его с предыдущим перед выводом. Это позволяет избежать частого вывода слишком маленьких блоков, но при этом по‑прежнему отображать данные в потоковом режиме.
output_format_pretty_squash_max_wait_ms
Выводит невыведенный блок в форматах Pretty, если с момента предыдущего вывода прошло больше указанного количества миллисекунд.
output_format_protobuf_nullables_with_google_wrappers
При сериализации столбцов типа Nullable с использованием оберток Google значения по умолчанию сериализуются как пустые обертки. Если параметр отключен, значения по умолчанию и null не сериализуются
output_format_schema
Путь к файлу, в котором автоматически сгенерированная схема будет сохранена в формате Cap'n Proto или Protobuf.
output_format_sql_insert_include_column_names
Добавлять имена столбцов в запрос INSERT
output_format_sql_insert_max_batch_size
Максимальное количество строк в одном операторе INSERT.
output_format_sql_insert_quote_names
Заключать имена столбцов в символы «`»
output_format_sql_insert_table_name
Имя таблицы в выходном запросе INSERT
output_format_sql_insert_use_replace
Использовать оператор REPLACE вместо INSERT
output_format_tsv_crlf_end_of_line
Если установлено значение true, символы конца строки в формате TSV будут \r\n вместо \n.
output_format_values_escape_quote_with_quote
Если значение true, экранировать ' как '', в противном случае заключать в кавычки как \\'.
output_format_write_statistics
Записывает статистику о прочитанных строках, байтах и затраченном времени в подходящих форматах вывода.
Включена по умолчанию
precise_float_parsing
Предпочитать более точный (но более медленный) алгоритм разбора чисел с плавающей запятой.
schema_inference_hints
Список названий и типов столбцов, которые используются в качестве подсказок при выводе схемы для форматов без схемы.
Пример:
Запрос:
Результат:
Если schema_inference_hints имеет некорректный формат, содержит опечатку, неверный тип данных и т.п., весь schema_inference_hints будет проигнорирован.
schema_inference_make_columns_nullable
Управляет приведением выводимых типов к Nullable при выводе схемы.
Возможные значения:
- 0 - выводимый тип никогда не будет
Nullable(используйте input_format_null_as_default, чтобы контролировать, как обрабатывать значения NULL в этом случае), - 1 - все выводимые типы будут
Nullable, - 2 или
auto- выводимый тип будетNullableтолько если столбец содержитNULLв выборке, которая разбирается во время вывода схемы, или если метаданные файла содержат информацию о допускаемости NULL в столбце, - 3 - допускаемость NULL для выводимого типа будет соответствовать метаданным файла, если формат их содержит (например, Parquet), в противном случае тип всегда будет Nullable (например, CSV).
schema_inference_make_json_columns_nullable
Управляет приведением выводимых типов JSON к Nullable при автоматическом определении схемы.
Если этот параметр включен вместе с schema_inference_make_columns_nullable, выводимый тип JSON будет Nullable.
schema_inference_mode
Режим определения схемы. default — предполагается, что все файлы имеют одинаковую схему, и схему можно определить по любому файлу; union — файлы могут иметь разные схемы, и результирующая схема должна представлять собой объединение схем всех файлов.
show_create_query_identifier_quoting_rule
Задаёт правило кавычирования идентификаторов в запросе SHOW CREATE
show_create_query_identifier_quoting_style
Определяет стиль заключения идентификаторов в кавычки в запросах SHOW CREATE
type_json_allow_duplicated_key_with_literal_and_nested_object
Когда настройка включена, допускается разбор JSON-объектов вида {"a" : 42, "a" : {"b" : 42}}, где некоторый ключ дублируется, но одно из его значений является вложенным объектом.
type_json_skip_duplicated_paths
При включении при разборе JSON-объекта в тип JSON дублирующиеся пути игнорируются, и вместо выбрасывания исключения вставляется только первое значение.
type_json_skip_invalid_typed_paths
При включении поля, значения которых не могут быть приведены к объявленному типу в столбцах типа JSON с типизированными путями, пропускаются вместо выброса ошибки. Пропущенные поля рассматриваются как отсутствующие и используют значения по умолчанию/null в соответствии с определением типизированного пути.
Этот параметр применяется только к столбцам типа JSON (например, JSON(a Int64, b String)), для которых для конкретных путей объявлены типы. Он не применяется к обычным форматам входных данных JSON, таким как JSONEachRow, при вставке в обычные типизированные столбцы.
Возможные значения:
- 0 — Отключить (вызывать ошибку при несоответствии типов).
- 1 — Включить (пропускать поле при несоответствии типов).
type_json_use_partial_match_to_skip_paths_by_regexp
Когда параметр включён, при разборе JSON-объекта в значение типа JSON регулярные выражения, заданные с помощью SKIP REGEXP, требуют частичного совпадения, чтобы путь был пропущен. Когда параметр отключён, для пропуска пути требуется полное совпадение.
validate_experimental_and_suspicious_types_inside_nested_types
Проверять использование экспериментальных и подозрительных типов внутри вложенных типов, таких как Array/Map/Tuple