Очистка данных в Excel — дубли, пробелы, даты за одну команду
«Грязные» данные — это 60% реальной работы аналитика. Выгрузка из CRM: пробелы по краям, даты то строкой «15.03.2025», то числом, ФИО в одной колонке, дубликаты строк из-за разной регистрации кавычек. Каждую из этих проблем решает отдельный инструмент Excel — TRIM, Text to Columns, Remove Duplicates, форматирование ячеек — и всё нужно запускать в правильном порядке, иначе дубли не распознаются, пока не обрезаны пробелы. SideGenius выполняет всё за один проход: «почисти A1:E220 — обрежь пробелы, приведи даты к YYYY-MM-DD, раздели FullName на Ф/И/О в F/G/H, убери дубли». AI сам выстраивает порядок операций (сначала trim → потом split → потом dedupe), знает особенности кириллических имён (Иванов-Петров через дефис — одна фамилия, не две) и европейских форматов дат (15/03/2025 это март, а не 15-го числа месяца 03).
За 8 секунд: пробелы уходят, даты меняют формат, F/G/H заполняются компонентами ФИО, 14 дубликатов исчезают. Вы видите дифф и можете откатить одной кнопкой.
Почему не ChatGPT
Чистка данных — это последовательность операций над файлом, которую нельзя выполнить через чат. ChatGPT даст 5 отдельных инструкций, и вы будете выполнять их руками по очереди, промахиваясь по ячейкам. SideGenius выполняет всё за вас и показывает дифф до-после.
Как использовать за 3 шага
Откройте Excel с «грязными» данными (обычно это выгрузка из CRM, анкета, импорт из PDF).
В панели SideGenius опишите, что нужно почистить и куда положить результат (если делите колонку — укажите, в какие ячейки).
AI покажет предварительный дифф. Подтверждаете — изменения применяются. Не подходит — жмёте «Откатить», возвращается исходник.
Вопросы и ответы
Как AI понимает, что в колонке — дата?
Анализирует первые 20 значений: если большинство матчатся паттерном дат (формат ISO, DMY, MDY) — распознаёт как даты. При неоднозначности спрашивает: «формат DMY или MDY?» и показывает примеры.
Правильно ли делит ФИО с двойными фамилиями?
Да. «Иванов-Петров Иван» воспринимается как фамилия «Иванов-Петров» + имя «Иван». Знает частицы «де», «фон», «ван» в западных именах. Для отчества проверяет окончания «-ович / -евна».
Убирает ли дубли по неполному совпадению?
По умолчанию — точное совпадение всех колонок. По запросу: «убери дубли по email игнорируя регистр» — применит case-insensitive сравнение и оставит первую встреченную запись.
Что делает с невалидными значениями — цифрами в колонке имени?
Отмечает как warning и предлагает варианты: оставить, удалить строку, вынести в отдельную колонку «к проверке». Ничего не удаляет молча.
Можно ли откатить изменения?
Да, одной кнопкой через Smart Rollback. SideGenius делает снимок файла до операции — откат возвращает его полностью.
Работает ли с датасетом 50 000 строк?
Да, но операция займёт 30–60 секунд. Для больших выборок AI предлагает сначала отобрать sample 500 строк и подтвердить логику, потом применить ко всему датасету.
Приводит ли телефонные номера к единому формату?
Да. «Нормализуй телефоны в колонке C к +7 (XXX) XXX-XX-XX» — AI уберёт пробелы, дефисы, скобки, распознает 8-ки и +7-ки, отметит мобильные коды РФ, флагирует номера вне формата (длина ≠ 11 цифр) как «к проверке» вместо молчаливого удаления.
Попробуйте SideGenius бесплатно
20 кредитов на старт, без карты. Работает в РФ без VPN, оплата картами РФ.
Установить в Excel