Содержание
Запчасти с авторазбора ВАЗ в Новосибирске — оригинальные б/у и контрактные
Цените свое время! Отправьте заявку в магазины и авторазборки прямо сейчас! |
1111 Ока2101210221032104210521062107210821092110211121122113211421152120 Надежда2121 4x421232129213123282329Lada GrantaLada KalinaLada LargusLada PrioraLada VestaLada XRAY
Здесь собраны объявления о продаже б/у запчастей на ВАЗ с
сайтов «Авито», «Из рук в руки» и др. Покупая автозапчасть с рук, обязательно убедитесь
в надёжности продавца и не переводите деньги, предварительно не получив запчасть.
Спойлер для ваз 2101, 2103, 2105, 2106, 2107 Цена 3 000 ₽
Фаркоп ваз 2113, 2114 Цена 4 000 ₽
Эбу мозги ваз январь 5. 1 2104-07 Цена 2 000 ₽
Тюнинг на классику ваз 2101-2107
Рамка радиатора 2107 (Телевизор 2107) Цена 1 900 ₽
Фапкоп на машину LADA xray 2017 Цена 9 590 ₽
Противотуманная фара Лада Гранта, Калина2, Ларгус Цена 300 ₽
Каркасные шторки для LADA 2109,21099,2114,2115 Цена 1 400 ₽
Крыло переднее на ваз 2113,2114,2115 Цена 3 700 ₽
Блокировка Нива в редуктор Цена 7 500 ₽
Чехлы LADA Priora Hb/Wag / 2112-11 Алькан Ромб Цена 7 490 ₽
Решётка штатная лада приора Цена 500 ₽
Шрус на Ваз 2108-2110 наружний Цена 982 ₽
Стеклоподъемники форвард ваз 2109 2114 2115 Цена 2 800 ₽
Багажник на Lada Prioraседан2007 Цена 4 357 ₽
Патрубки радиатора силиконовые на автомобили Ваз
Двигатель ваз 2109 21083 оптом Цена 4 500 ₽
Багажник уникар на рейлинги ваз-2123 Chevrolet Niv Цена 11 030 ₽
Зеркала на ваз-2108-2109-21099-2113-2114-2115 Цена 800 ₽
Катушка лада Цена 600 ₽
Кронштейн сидения Нива Ваз 2121-2131 Цена 750 ₽
Подлокотник Ваз 2113 / 2114 / 2115 / лада Цена 850 ₽
Магнитные каркасные шторки на ваз 2106 Цена 1 990 ₽
Адаптер салонного фильтра
Фаркоп ваз 2110,2111,2112,2170, 2171, 2172 Цена 4 000 ₽
Втулка промежуточная Ваз 2121 2121 ваз 21214 2015 Цена 200 ₽
Эбу Мозги на ваз Лада X-RAY 8450020385 I785XMH6 Цена 7 500 ₽
Продам блок предохранителей ваз 2105 Цена 500 ₽
Магнитола LADA Priora 1 07-13г 1/16GB Цена 13 000 ₽
Фильтр топливный ваз лада
Коммутатор на ваз 2108 на ваз 2109 Цена 350 ₽
Зеркала наружние заднего вида Лада Приора Цена 4 200 ₽
Эбу Мозги на Ваз Ларгус Веста X-RAY М86 эбу Лада Цена 3 400 ₽
Зеркало салонное на ваз 2105-07 Цена 300 ₽
Для Ваз 2121 Нива. сиденья
Решетка на заднее стекло ваз 2101, 2103, 2105, 210 Цена 1 044 ₽
Обшивка задних дверей LADA (Ваз) Largus
Пороги ремонтные ваз Классика Цена 2 000 ₽
Электроусилитель руля для ваз 2105, 2107 Цена 27 500 ₽
Ваз 2115 по запчастям Цена 5 000 ₽
Дверь боковая передняя левая Лада Веста 2015 — Н Цена 10 000 ₽
Обивки салона ваз, приора, гранта, калина, ларгус
Порог кузовной LADA (ваз) 2104 Цена 1 750 ₽
Сцепление ваз 2108-2115 Цена 1 300 ₽
Чехлы LADA 2114-15 (09,099,13 / 2131Нива 5дв.) ром Цена 7 490 ₽
Зеркало Ваз 2101, 2104, 2105, 2106, 2107 штатное Цена 250 ₽
Фаркоп LADA 2105
Бензонасос ваз 2101-2107 Цена 500 ₽
Динамик лада для сабвуфера
Новый Задний редуктор рзм ваз 2123 Нива Шеви Цена 6 900 ₽
Задняя независимая подвеска ваз 2108,2113,2114 Цена 29 000 ₽
Электропроводка на ваз 11113 ока Цена 4 000 ₽
Поворотники ваз 2114 Цена 800 ₽
Веста седан — св диффузор заднего бампера Цена 1 800 ₽
Патрубок системы охлаждения Ваз 2121 2121 ваз Цена 200 ₽
Монтажный блок ваз 2114 Цена 1 300 ₽
Опора шаровая, Трек Чемпион, ваз 2101-07 Цена 2 572 ₽
Шатуны ваз 21126 Цена 2 500 ₽
Радиатор ваз 2110, 2111, 2112
Фара Ваз 2104, 2105, 2107 Цена 1 100 ₽
Автомобильные коврики резиновые LADA Vesta АКПП Цена 1 300 ₽
Руль Веста анатомический Цена 9 000 ₽
Подлокотник для ваз 2105-2107 Цена 1 300 ₽
Шаровая опора Нива Шеви ваз 2123 2131 21213 усилен Цена 350 ₽
Двигатель после капитального ремонта 13000
Ремчасть заднего крыла Нива Шевроле Ваз 2123 Цена 2 000 ₽
Радиатор печки Нива 2121-2131 медный трёхрядный Цена 4 200 ₽
Мотор стеклоочистителя ваз 2101-2107, 2121 Цена 1 000 ₽
Коллектор
Крышка для бензобака Цена 200 ₽
Подлокотник ваз 2104 / 2105 / 2106 / 2107 / лада Цена 1 300 ₽
Даунпайп ваз 2108-21099, 2113-2115 Цена 4 600 ₽
Карбюратор ваз 2108-2115 21083 Цена 4 500 ₽
Щуп масляный Лада Веста Кросс GFK ваз21129 2018 Цена 200 ₽
Амортизатор ваз-1118 «Калина «,задний Сааз Цена 1 000 ₽
Авторазбор ВАЗ в Екатеринбурге | Автозапчасти Lada бу
Фильтр
Каталог
2110
Granta 2011-2018
Kalina 2004>
Largus 2012>
Niva 2131
Priora 2008>
Vesta 2015-
X-RAY 2016>
ВАЗ 2107
ВАЗ 2108
ВАЗ 2109
ВАЗ 2111
ВАЗ 2112
ВАЗ 2113
ВАЗ 2114
ВАЗ 2115
Расходники ВАЗ
12 шт.
800 р.
4 000 р.
500 р.
800 р.
800 р.
800 р.
300 р.
1 500 р.
800 р.
800 р.
800 р.
Lada — доступный и популярный отечественный автомобиль. Он экономичен, достаточно надежен и весьма практичен. При выполнении ремонтных работ или в ходе технического обслуживания автовладельцу понадобятся запчасти и комплектующие. Безусловно, можно приобрести новые запчасти, но рациональным решением будет установка б/у оригинальных автодеталей, таких как радиатор, двигатель, стартер, фара, стойки, сиденья и других, снятых в процессе разбора Лада. «Авторазбор «Левый руль» делает максимально выгодное предложение для автомобилистов из УрФО, предлагая качественные и доступные детали, снятые с автомобилей ВАЗ 2114, Калина, Гранта, Приора после 2005 года выпуска.
Авторазбор ВАЗ Екатеринбург выполняют опытные специалисты. Затем запчасти проходят строгое тестирование, по результатам которого устанавливается стоимость. Мы можем гарантировать, что цены будут одними из самых выгодных в Уральском Федеральном округе. А качество деталей мы гарантируем, поскольку дорожим своей репутацией и каждым клиентом. Вы можете заказать даже ту деталь, которую не нашли в нашем каталоге. Менеджеры быстро найдут ее. Возможен самовывоз товара со склада, также для вашего удобства предлагается сервис адресной доставки. Авторазбор ВАЗ Екатеринбург — это ваша возможность эффективно восстановить машину, сэкономив денежные средства.
Анализ цен на автомобили
Следующие данные были взяты с сайта turbo.az. Этот сайт является популярной общедоступной платформой для покупки и продажи автомобилей в Азербайджане. Полученные данные содержат информацию о владельце автомобиля, а также о самом автомобиле, включая номера мобильных телефонов, год выпуска автомобилей, мощность двигателя, пробег и т. д. Мы проанализировали данные 19819 наблюдений и 24 переменных в R Studio. Мы наблюдаем, что из 24 переменных 14 переменных являются качественными и 10 количественными. Для точного описания схема данных показана ниже.
Цена
Цена на автомобили нестабильна и зависит от различных факторов. Основными факторами являются экономическое состояние и валюта страны. Кроме того, физические характеристики автомобиля, такие как модель, год выпуска, марка, объем двигателя и пробег, могут оказывать существенное влияние на его стоимость. Мы видим, что в турбо-датасете стоимость автомобилей включает в себя разные валюты, такие как манаты, доллары США и евро. Поскольку веб-сайт базируется в Азербайджане, цены на большинство автомобилей указаны в манатах. Однако, поскольку доллар США является сильной международной валютой, многие автомобили также продаются/покупаются в этой валюте. Ниже мы представляем таблицу со статистикой наиболее используемых валют.
3641 | 52 | 16126 |
Марка
Данные показывают, что марки Mercedes, Hyundai и BMW являются наиболее распространенными марками, которые публикуются на веб-сайте. Мы представляем цифры для каждой марки автомобиля в следующей таблице.
резюме(turbo$marque)
## Mercedes LADA ВАЗ Hyundai BMW ## 4657 3273 1380 1087 ## Опель Тойота Киа Фольксваген ## 1014 988 700 639 ## Ниссан Форд ГАЗ Мицубиси ## 611 568 479 460 ## Ленд Ровер Шевроле Лексус Дэу ## 438 331 306 291 ## Ауди Рено Тофас Порше ## 202 173 145 144 ## Джип КамАЗ Мазда Хонда ## 126 109107 97 ## Инфинити Иран Ходро Фиат Чанган ## 95 87 81 60 ## Субару Сайпа ЗИЛ Чери ## 57 50 49 43 ## Great Wall Peugeot Dodge Lifan ## 42 40 38 38 ## СуШаки SEAT Bentley Chrysler ## 37 36 30 29## УАЗ Cadillac HOWO Volvo ## 29 24 24 24 ## МАЗ Москвич Равон Хаммер ## 23 23 23 22 ## BYD MAN Мазерати Шакман ## 21 21 21 21 ## Джили Шкода IJ Iveco ## 20 20 1919 ## Байк Дачия Ямаха Ситроен ## 16 16 16 15 ## Isuzu Mini Zontes DAF ## 15 15 15 14 ## ГАЦ Фотон ЗАЗ Ssang Yong ## 14 13 13 12 ## MG Jaguar GMC Муравей ## 11 10 96 ## Rolls-Royce Alfa Romeo Днепр DongFeng ## 6 5 5 5 ## Мерседес-Майбах Урал Бьюик Даюн ## 5 5 4 4 ## Хаоцзюэ Harley-Davidson Haval JAC ## 4 4 4 4 ## ПАЗ Смарт BMW Alpina Ducati ## 4 4 3 3 ## Икарус Jonway MV Agusta Vespa ## 3 3 3 3 ## Астон Мартин Кан-Ам Дайхатсу FAW ## 2 2 2 2 ## JMC KawaShaki Temsa (Другое) ## 2 2 2 23
Объем двигателя
Объем двигателя, объем двигателя или мощность двигателя указывают на то, насколько большое пространство в двигателе занимает поршень. поршень двигателя способен проталкивать больше воздуха и топлива. Чем больше объем двигателя в литрах, тем дороже автомобиль. Объем двигателя обычно выражается в литрах (л) или кубических сантиметрах (см). В наших данных он выражается в литрах (л) и выводится ниже.
головка(турбо$двигатель_объем)
## [1] 2,5 л 2,0 л 2,4 л 2,2 л 2,5 л 2,4 л ## 76 Уровни: 0,1 л 0,2 л 0,3 л 0,4 л 0,5 л 0,6 л 0,7 л 0,8 л 0,9 л ... 9,5 л
Цвет
веб-сайте данные были восстановлены. Можно заметить, что в собранных данных на круговой диаграмме 5717 белых, что составляет 28,8% автомобилей, и 4950 черных, что составляет 25% автомобилей. Эти цифры являются очевидным показателем предпочтения цвета при покупке автомобиля в Азербайджане.
plot_ly(turbo, labels = ~color, type = 'pie') %>% layout(title = 'Цвет машин', xaxis = список (showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE), ось y = список (showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE), zaxis = список (showgrid = FALSE, zeroline = FALSE, showticklabels = FALSE) )
Мощность двигателя
Мощность двигателя — это максимальная мощность, которую может развивать двигатель. Она может быть выражена в киловаттах или лошадиных силах. Выходная мощность зависит от размера и конструкции двигателя, а также от скорости. Выход мощности двигателя в наших данных показывает, что мощность двигателя лежит в интервале [5, 999] со средней мощностью 166,22 кВт.
glimpse(turbo$engine_power)
## int [1:19819] 192 136 170 170 183 180 177 125 75 233 ...
Пробег
Пробег — одно из важнейших свойств, которое следует учитывать при покупке подержанный автомобиль. Согласно обзору литературы, это оказывает большое влияние на цену автомобиля. Чем больше пробег, тем ниже цена автомобиля. Но это не всегда так, двухлетняя машина с пробегом 100 000 может считаться менее хорошей машиной, чем 10-летняя машина с пробегом 50 000 миль.
Slimpse (Turbo $ пробег)
## int [1: 19819] 350000 216000 282000 248253 96500 83000 281000 126000 262000 134500 ...
Город
цена автомобиля. Например, подержанный автомобиль с пробегом 10 000 миль, который проводит свою жизнь в Гяндже, будет отличаться от подержанного автомобиля с пробегом 10 000 миль, прибывшего из Баку.
турбо %>% выбрать(город) %>% уникальный() %>% мельком()
## Наблюдения: 64 ## Переменные: 1 ## $ cityБаку, Имишли, Сиазань, Гянджа, Ширван, Мингячевир, Хырд...
Шестерня
Шестерня позволяет управлять автомобилем с минимальной нагрузкой на двигатель (Успех вождения, 2017). В современных автомобилях имеется пять передних и одна задняя передачи. Теперь у некоторых автомобилей есть шестая передача переднего хода, которая обеспечивает автомобилям большую экономию топлива при движении автомобиля на более высоких скоростях на большие расстояния. Большинство автомобилей имеют заднюю передачу (arxa).
сводка(турбо$шестерня)
## Аркса Он Там ## 8614 6375 4830
Расчет справедливой цены подержанного автомобиля с помощью анализа данных | Кирилл Лепченков
Весь путь использования методов DS для расчета справедливой цены на подержанный автомобиль.
Введение
Каков обычный способ определения цены на подержанный автомобиль? Вы ищете похожие автомобили, оцениваете приблизительную базовую цену, а затем настраиваете ее в зависимости от текущего пробега, цвета, количества опций и т. д. Вы используете как знание предметной области, так и анализ текущего состояния рынка.
Если копнуть глубже, можно подумать о продаже машины в другом регионе страны, где средняя цена выше. Вы даже можете узнать, как долго автомобили находятся в каталоге, и обнаружить образцы с завышенной ценой, чтобы принять более взвешенное решение.
Оригинальная реклама универсала VW Passat конца 1990-х годов в цвете « Rosso corsa », который по статистике датасета оказался «средним автомобилем» в Беларуси было « Возможно ли, что использование методов науки о данных (сбор и очистка данных, обучение моделей машинного обучения и т. д.) может сэкономить ваше время и умственные усилия в болезненном процессе принятия решений? ”
Я открыл ноутбук, создал новый проект и включил таймер.
Этап 1. Сбор данных
Не вдаваясь в подробности: мне удалось за два дня собрать набор данных, содержащий примерно 40 000 объявлений об автомобилях с 35 функциями (в основном по категориям). Сбор данных сам по себе не составил особого труда, но их упорядоченное структурирование заняло немного времени. Я использовал Python, Requests, Pandas, NumPy, SciPy и т. д.
Что интересно в этом конкретном наборе данных, так это то, что большинство категориальных признаков никак не закодированы и поэтому могут быть легко интерпретированы (например, engine_fuel = «дизель»).
Этап 2. Глядя на общую картину и работая с неверными данными
Первоначальный анализ данных быстро выявил подозрительные образцы с пробегом 8 миллионов километров, хэтчбеки с 10-литровым двигателем, гибридные дизельные автомобили за 600 долларов и т. д. Я потратил примерно 6 часов написания сценариев для обнаружения этих проблем и их обработки.
Визуализация данных (я использовал MatPlotlib и Seaborn) дала мне хорошее представление об общей ситуации на рынке.
Распределение значений одометра (расстояние, пройденное транспортным средством в километрах)
Большинство автомобилей довольно интенсивно эксплуатируются со средним пробегом odometer_value 250 000 километров, и это очень много! Я также заметил, что люди предпочитают присваивать odometer_value красивые числа, например, 250 000 км, 300 000 км, 350 000 км и т. д. У многих автомобилей миллион километров odometer_value и это не имеет особого смысла, если смотреть на распределение значений. Могу предположить, что 1 миллион километров — это скорее утверждение «Эта машина повидала многое, точное количество километров на ней я, честно говоря, не знаю».
Общая тенденция ценообразования на автомобили интуитивно понятна: чем старше автомобиль, тем ниже цена. Я ожидал, что возраст автомобиля будет характеристикой номер один в общей иерархии характеристик.
Кроме того, чем старше автомобиль, тем выше его odometer_value в общем и то разумно.
Чтобы построить точечную диаграмму price_usd , я ограничил максимальную цену автомобиля примерно на 50 000 долларов и удалил несколько выбросов на уровне миллионов километров odometer_value .
На самом деле автомобили стоимостью менее 50 000 долларов США составляют 99,9 % каталога, поэтому точечный график дает хорошее представление о ценовой тенденции.
Что касается возраста автомобилей: большинство автомобилей были в эксплуатации некоторое время, в среднем год выпуска значение 2002 года. Я считаю, что на распределение года выпуска (изображенное ниже) сильно повлияла политика в отношении таможенных пошлин на ввоз автомобилей из-за границы.
Распределение автомобилей в каталоге по году выпуска.
Распределение цен ( price_usd будет целевым значением в этом проекте во время обучения модели) сильно смещено вправо со средней и медианной ценой 7275 и 4900 долларов соответственно.
распределение цен
Некоторые функции, такие как up_counter (количество раскруток объявления вручную) вообще не отражают параметры автомобиля, но так как эти данные были доступны, я решил включить их в проект. Распределение было настолько асимметричным, что единственным способом его правильного построения было использование логарифмической шкалы.
распределение метрики up_counter
Распределение популярности брендов не стало для меня неожиданностью, так как самой популярной моделью в каталоге стал VW Passat, легендарный источник транспорта в Беларуси.
Я также использовал Tableau, чтобы получить более наглядное представление о доле производителя на рынке и средней цене для каждого бренда.
Форма распределения number_of_photos автомобилей аналогична распределению price_usd (распределение смещено вправо).
Распределение количества фотографий перечисленных автомобилей
Может быть, чем выше цена автомобиля, тем больше фотографий?
Я сделал совместный график, который показывает небольшую корреляцию, но что более важно, он ясно показывает, что большинство автомобилей дешевые и имеют менее 15 фотографий.
Некоторые функции, такие как трансмиссия , были просто интересны для изучения. На гистограмме ниже видно, как за последние 30 лет уменьшился процент заднеприводных автомобилей.
Гистограмма, иллюстрирующая переход от заднего привода к переднему и полному приводу за последние годы
Вся матрица корреляции для набора данных изображена ниже (большинство функций в наборе данных говорят сами за себя, за исключением feature_0 … функция_9 : это логические столбцы, которые указывают, что у автомобиля есть такие функции, как легкосплавные диски, кондиционер и т. д.)
Корреляционная матрица для всего набора данных
Я не собираюсь публиковать здесь полный исследовательский анализ, вы можете проверить его в ядре . Я потратил примерно шесть часов (и мне нужно еще 60 часов, чтобы исправить проблемные образцы в наборе данных), копаясь в данных, инженерных функциях, и только потом я перешел к обучению модели.
Этап 3. Обучение модели
Поскольку я уже очистил набор данных и применил некоторые функции проектирования с учетом будущего машинного обучения, создание и обучение базовой модели было очень простым делом.
Чтобы получить максимальные результаты с наименьшими усилиями, я использовал CatBoost (повышение градиента в библиотеке деревьев решений с полной поддержкой категориальных функций, разработанной и открытой Яндексом). Я уже потратил слишком много времени на проект, поэтому я просто добавил данные в модель, настроил скорость обучения, глубину дерева и числовые деревья в ансамбле, обучил несколько моделей и начал изучать процесс принятия решений с помощью SHAP (разработан Скотт Лундберг и др. ). Общее время потрачено: 4 часа.
Забавный факт: на начальном этапе исследования прогноза я был разочарован производительностью модели, начал исследовать ошибки и обнаружил, что столбец цен в моем наборе данных был проанализирован неправильно, некоторые цены были указаны в долларах США, а некоторые — в национальной валюте. валюта Беларуси: BYN. Я исправил код парсера, снова собрал данные, затем запустил задания по очистке, разработке функций и аналитике и начал обучение моделей с гораздо лучшими результатами.
Для обучения и оценки первой модели я отфильтровал автомобили с ценой выше 30 000 долларов (на этапе исследования я обнаружил, что для этих образцов нужна отдельная модель).
Стадия 4. Оценка модели
У меня не было времени и вычислительных ресурсов для выполнения надлежащего поиска по сетке и последовательного выбора признаков (SFS), поэтому я просто несколько раз настроил количество деревьев и скорость обучения и использовал 5-кратный кросс -валидация для оценки производительности модели (проверка полного ядра).
График иллюстрирует обучение модели: количество деревьев по оси X и MAE $ по оси Y
Первая достойная модель CatBoost позволила мне получить MAE примерно в 1000 долларов (средняя абсолютная ошибка), что составляет 15 % от среднего значения price_usd. цель. Чтобы быть точным в оценке:
Лучшая оценка MAE проверки: 1019,18 долларов США на итерации 6413 со стандартными 12,84 долларов США
Не пытаясь каким-либо образом улучшить модель, я перешел к прогнозному анализу.
Распределение ошибок
Рассмотрение распределения ошибок и графиков двумерных гистограмм для истинных и прогнозируемых значений мало что говорит о качестве прогнозов.
Двухмерный график гистограммы для истинных и прогнозируемых значений. Вы можете заметить плотную область ниже порога
в 3000 долларов. Иерархия значений SHAP (отображены только 20 лучших функций) для функций в наборе данных не показались мне удивительными, за исключением низкого положения функции odometer_value . Вы можете найти хорошее объяснение интерпретации непараметрической модели в статьях, подобных этой.
Summary_plot for top 20 features
Возраст автомобиля, марка, тип кузова, объем двигателя и трансмиссия находятся на вершине иерархии, и это кажется вполне разумным.
Состояние Интересная особенность оказалась: подавляющее большинство автомобилей «собственные», но есть небольшой процент «новых» автомобилей (они дорогие) и некоторое количество «аварийных» автомобилей, которые поврежден.
Проблема с поврежденными автомобилями очевидна: столбец булев и нет степени этого «аварийного состояния» (об этом позже).
Этап 5. Изучение индивидуальных прогнозов с использованием знаний предметной области и определение ограничений модели
Изучение индивидуальных прогнозов быстро дало мне представление об ограничениях как модели, так и данных. Я включу в список несколько примеров, чтобы дать лучшее представление о процессе принятия решений моделью.
Образец 0: VW T5 Caravelle, 2009 г. , механическая коробка передач, 287 000 км, дизель. Указанная цена 13 600 долларов США. Прогноз ниже на 1200 долларов США (MAE для модели составляет около 1000 долларов США, так что это довольно типичный случай).
Интерпретация прогноза (force_plot) для T5 Caravelle
Вы можете видеть, что Volkswagen марки и минивэн body_type вносят свой индивидуальный вклад в повышение прогнозируемой цены образца.
Интерпретация прогноза (decision_plot) для T5 Caravelle
Используя SHAP, мы можем построить интерпретацию принятия решений еще более удобным способом, используя функцию «график решений».
Графики решений недавно были добавлены в библиотеку и обеспечивают еще более подробное представление о внутренней работе модели.
Основное преимущество графиков принятия решений по сравнению с графиками сил заключается в том, что они могут четко отображать большее количество функций.
Подробнее об этом типе участков можно прочитать здесь.
Образец 1: Mercedes-Benz E270, 2000 г., механическая коробка передач, 465 000 км, дизель. Указанная цена 4999 долларов. Прогноз выше на 198 долларов. Это совсем не плохо!
Интерпретация прогноза для E270 Mercedes
Образец 2: Jeep Grand Cherokee, 2007 г., коробка автомат, 166 000 км, дизель. Указанная цена 14 500 долларов. Прогноз ниже на 2796 долларов. Плохой прогноз, на первый взгляд, но модель числилась в каталоге 498 дней! Такое ощущение, что цена на этот конкретный образец была действительно завышена. Он также числится в беднейшем регионе страны, где автомобили в целом дешевле и числятся на более длительный период времени.
Толкование предсказаний для Jeep Grand Cherokee
Образец 3: VW Passat, 2012 г., коробка автомат, 102 000 км, бензин. Указанная цена составляет 11 499 долларов США. Прогноз ниже на 64 доллара.
Толкование прогноза для VW Passat
Образец 4: ВАЗ 2107 (российский автомобиль), 1987 г.в., МКПП, 120 000 км, бензин. Цена указана $ 399 . Прогноз выше на 34 доллара. Это тот, кто находится в нижней части ценового спектра.
Интерпретация прогноза для ВАЗ 2107
Мы видим, как в основном все значения характеристик этой выборки отрицательно влияют на прогнозируемую цену.
Образец 5: VW Passat , 1992 год, механическая коробка передач, 398 000 км, бензин. Цена указана 750 долларов. Предсказание выше на 721 доллар (почти в два раза больше указанного значения)! Почему?
Предсказанная интерпретация для аварийного VW PassatАктуальное изображение «аварийного» VW Passat образца
Если мы посмотрим ближе к модели интерпретации, то увидим, что 9Состояние 0090 = чрезвычайная ситуация вносит важный вклад в прогнозируемую цену. Дальнейшее ручное расследование этого конкретного случая показало, что автомобиль был поврежден упавшим деревом.
Это явное ограничение существующих данных: логическое значение столбца state просто не может отразить общий спектр уровней повреждений. Я считаю, что эту проблему можно «легко» решить, применив еще два механизма: анализ изображений с помощью какой-либо предварительно обученной глубокой CNN и извлечение объектов из описания выборки с использованием RNN.
Я закончу эту подборку роскошным BMW 3-й серии.
Образец 6: BMW 316 , 1994 г.в., МКПП, 320 000 км, бензин. Указанная цена $ 1650 . Прогноз выше на 55 долларов. Мы ясно видим, что принадлежность к люксовому бренду дает образец несколько баллов.
Интерпретация прогноза для BMW 316
Я потратил примерно 3 часа на изучение прогнозов модели и изучение образцов вручную.
Техническое заключение
Я получил MAE примерно на 1000 долларов США, используя CatBoost Regressor для всего набора данных. Но я также попытался использовать тот же подход для отдельных моделей и сразу уменьшил ошибку вдвое до 500 долларов. Я считаю, что производительность модели будет еще выше, если мы разделим набор данных на поднаборы данных на основе признака year_produced и обучим несколько моделей на этих поднаборах данных.
Я тоже думал, что duration_listed можно использовать для штрафа за вес выборки в наборе данных. Например, если автомобиль указан в течение года, это, вероятно, означает, что цена установлена слишком высокой, поэтому мы можем уменьшить вес этого образца, используя функцию объединения.
В целом мне кажется, что модель, которую я обучил, работает достаточно хорошо, но есть много возможностей для дальнейшего улучшения.
Что касается технологий, используемых в этом проекте: CatBoost кажется правильным выбором, потому что он обеспечивает отличную встроенную поддержку категорийных функций. Обучение с 5-кратной перекрестной проверкой заняло около 13 минут на компьютере 2019 года.MacBook pro, но если бы у меня были миллионы образцов в наборе данных, это не было бы проблемой, потому что CatBoost поддерживает обучение на графическом процессоре. Он также имеет очень быстрое время прогнозирования, что помогает, когда модели переходят в производство.
Общий вывод
Вопрос, на который я пытался ответить в этом приключении, звучит так: «Может ли использование методов науки о данных быть оправданным, если вы собираетесь продать собственную машину?» Очевидный ответ на этот вопрос: нет : вам будет гораздо легче определить цену, если вы просто вручную будете искать похожие автомобили в Интернете. Мне потребовалось несколько дней, чтобы завершить проект простым способом, и я мог бы сделать гораздо больше, чтобы улучшить производительность модели, например применить правильный выбор функций, поиск по сетке и т. д.
В то же время, ответ определенно да , если у вас есть сотни или тысячи автомобилей для продажи. Используя Python и богатую экосистему пакетов обработки данных, вы можете автоматизировать работу по сбору данных, построению аналитики и обучению прогностических моделей.