Классификация масла: расставляем все по полочкам — Eurorepar Авто Премиум

Содержание

Что такое классификация моторных масел для двигателей

C (Commercial – CC, CD, CE, CF, CG, CH и CI) класс масел для дизельных двигателей — CC, CD, CE, CF, CG, CH и CI. Категории качества моторных масел идут в хронологическом порядке, и каждое следующее поколение получает новую букву. Первая указывает на категорию, вторая – на эксплуатационные свойства.

На практике это означает, что, скажем, за индексом CD скрывается класс смазочных материалов для мощных дизельных двигателей с турбонаддувом, имеющие высокие противоизносные свойства и предотвращающие образование нагара.

Классификация ACEA

Стандарт, введенный Ассоциацией Европейских производителей автомобилей ACEA (Association des Constructeurs Europeens de L’Automobile), часто дублирует классификацию API. Он включает в себя три категории, исходя из типа двигателя – A, B и E (бензиновые, дизельные моторы для легковушек и коммерческой техники, а также дизельные агрегаты для тяжелого транспорта соответственно). Деление на классы происходит в соответствие с эксплуатационными свойствами.

Моторные масла для бензиновых и легких дизельных двигателей выделены в категории А1/В1, А3/В3, А3/В4, А5/В5. Для бензиновых и легких дизельных двигателей с каталитическими системами доочистки действуют стандарты С1, С2, С3, С4). Для тяжелонагруженных моторов на солярке – Е4, Е6, Е7, Е9. S В чем разница между маслом с индексом A3/B3 и A3/B4? В первом случае расшифровка речь идет о стойких к механической деструкции маслах с высокими эксплуатационными свойствами, для высокофорсированных бензиновых и дизельных двигателях легковых и легких грузовых транспортных средств и/или для применения с увеличенными интервалами между сменами масла в соответствии с рекомендациями производителей двигателей, и/или для всесезонного применения маловязких масел, и/или всесезонного применения в агрегатах, работающих в тяжелых условиях.

Маркировка во втором случае указывает масла с высокими эксплуатационными свойствами для высокофорсированных бензиновых и дизельных двигателях с непосредственным впрыском топлива, также пригодные для применения согласно спецификации А3/В3.

Классификация Global DLDd

Стандарт спецификаций для дизельных моторов легковых автомобилей и легких коммерческих грузовиков (до 3,9 т) создан Ассоциацией Европейских производителей автомобилей (ACEA), Ассоциацией компаний-изготовителей двигателей США (EMA) и Японской ассоциацией изготовителей автомобилей (JAMA). Global DLD включают в себя три категории – DLD-1 (соответствие делает масла пригодными для рынков, где продается топливо с высокими содержание серы), DLD-2 (соответствуют высоким требованиям по эксплуатации и топливной экономичности) и DLD-3 (максимально высокие эксплуатационные характеристики).

Классификация российских моторных масел по ГОСТ 17479.1-85

А Нефорсированные бензиновые и дизельные двигатели.
Б Б1 Малофорсированные бензиновые двигатели, работающие в условиях, высоких температур, в результате чего в них накапливаются отложения, а также ржавеют подшипники.
Б2 Малофорсированные дизельные двигатели.
В
В1
Среднефорсированные бензиновые двигатели, работающие в условиях, при которых часто окисляется масло и образуются все типы отложений.
В2 Среднефорсированные дизельные двигатели с повышенными требованиями к антикоррозионным и противоизносным свойствам моторных масел. Способность масла блокировать образование высокотемпературных отложений.
Г Г1 Высокофорсированные бензиновые двигатели, работающие в тяжелых условиях, вследствие которых масло окисляется, образуя ржавчину и все виды отложений.
Г2 Высокофорсированные дизельные двигатели с умеренным наддувом или вовсе без наддува, работающие в условиях при которых образуются высокотемпературные отложения.
Д Д1 Высокофорсированные бензиновые двигатели, работающие в условиях, ещё более тяжелых, чем двигатели масел группы Г1.
Д2 Высокофорсированные дизельные двигатели с наддувом, работающие в тяжелых условиях. Также это двигатели у которых топливо требует масло с высокой нейтрализующей способностью, малой склонностью к образованию разных отложений, также с противоизносными и антикоррозионными свойствами.
Е Е1 Высокофорсированные бензиновые и дизельные двигатели, работающие в условиях ещё более тяжелых, чем двигатели для масел групп Д1 и Д2. Повышенная рассеивающая способность и лучшими противоизносные свойства
Е2

Классификация масел по ACEA

Выбор подходящего типа моторного масла не только продлевает цикл «жизни» вашего двигателя, но также позволяет вашему двигателя работать с той эффективностью, которая заложена производителем. Это, в свою очередь, увеличивает эффективность, и позволяет снизить средние расходы на топливо. Но перед тем, как взглянуть на экономическую составляющую, всегда важно правильно интерпретировать техническую часть. Классификация масел по ACEA призвана облегчить выбор смазочных материалов для двигателя, и структурировать эти масла по свойствам. Ниже мы опишем актуальные спецификации ACEA, чтобы вы не допускали ошибок, которые могут привести к непоправимым последствиям.

Европейская ассоциация автопроизводителей ACEA разрабатывает и внедряет спецификации масла, которые позволяют классифицировать все масла по тем или иным отличительным признакам. Обязательное обновленные требований ACEA к моторным маслам каждые 4 года (самое последнее в 2016), эти спецификации состоят из одной буквы, которая выделяет класс, и числа, которое определяет категорию. Например A5, C3, E9 и другие.

При подборе масла по спецификации ACEA, в первую очередь необходимо отталкиваться от рекомендаций изготовителя автомобиля.

Класс ACEA A – для легковых бензиновых двигателей.

Класс ACEA B – для легковых и лёгких коммерческих дизельных двигателей.
Класс ACEA C – для легковых и лёгких коммерческих дизельных двигателей, с современными систмами очистки выхлопных газов.
Класс ACEA E – для высоконагруженных дизельных двигателей тяжёлого коммерческого транспорта
.

Категория ACEA A / B предназначена для автомобилей без современных устройств для последующей обработки выхлопных газов, таких как DPF/GPF (дизельный/бензиновый сажевый фильтр) или SCR (катализатор с селективным каталитическим восстановлением).

ACEA A1/B1

Класс A1/B1 был аннулирован во время введения обновления требований ACEA 2016 года, как не отвечающий современным требованиям. Взамен рекомендуется использовать категорию ACEA A5/B5.

ACEA A3/B3

Моторные масла A3/B3 подходят для увеличенных интервалов смены масла, если это указано производителем двигателя, и / или для круглогодичного использования или для тяжелых условий эксплуатации, определенных изготовителем агрегата.

Масла спецификации A3/B3 подойдут для большинства моторов не самой новой конструкции и без современных систем очистки отработанных газов. Вероятно, что в редакции ACEA 2020 класс A3/B3 будет исключён.

Масла ACEA A3/B4 встречаются с вязкостью SAE 0W-30, 0W-40, 5W-30, 5W-40, 5W-50, 10W-40, 10W-50, 10W-60, 15W-40, 15W-50.

ACEA A3/B4

Опять же, моторные масла спецификации ACEA A3/B4 пригодны для использования в легковых и лёгких коммерческих автомобилях с бензиновым или дизельным двигателем. Важно отметить, что эти масла также подходят для использования там, где требуется ACEA A3/B3.

На сегодняшний день, на территории РФ именно ACEA A3/B4 самая распространённая и востребованная на рынке спецификация моторных масел. Подходит для огромного количества европейских автомобилей, а также для автомобилей не первой свежести азиатского производства.

Масла ACEA A3/B4 встречаются с вязкостью SAE 0W-30, 0W-40, 5W-30, 5W-40, 5W-50, 10W-40, 10W-50, 10W-60, 15W-40, 15W-50.

ACEA A5/B5

Моторные масла класса ACEA A5/B5 (заменяет A1/B1) пригодны для использования с увеличенными интервалами смены в бензиновых и дизельных двигателях, предназначенных для использования масел с пониженной вязкостью HTHS*1 (высокотемпературная вязкость при высокой скорости сдвига) от 2,9 до 3,5 мПа*с. Эти масла не подходят для использования в определенных двигателях, поэтому не забывайте всегда обращаться к руководству по эксплуатации производителя.

Масла ACEA A5/B5 встречаются с вязкостью SAE 0W-20, 0W-30, 5W-20, 5W-30, 10W-30.

ACEA C — категория моторных масел совместимых с современными системами очистки выхлопных газов, таких как DPF (дизельный сажевый фильтр) или SCR (Катализатор с селективным каталитическим восстановлением).

ACEA C1

Масла ACEA C1 являются смазками высочайшего уровня c низким уровнем SAPS

*2. Они пригодны для использования в высокоэффективных бензиновых и лёгких дизельных двигателях, где используются передовые системы последующей обработки, такие как дизельные сажевые фильтры (DPF/GPF) и трехступенчатые катализаторы (SCR). Спецификация ACEA C1 обычно сочетается с JASO DL-1.

Масла ACEA C1 должны иметь пониженную вязкость HTHS*1 (≤ 3,5 мПа*с) Вязкость SAE 5W-30.

ACEA C2

Масла ACEA C2 являются смазками высочайшего уровня c низким уровнем SAPS*2. Они пригодны для использования в высокоэффективных бензиновых и легких дизельных двигателях, где используются передовые системы последующей обработки, такие как сажевые фильтры (DPF/GPF) и трехступенчатые катализаторы (SCR).

Масла ACEA C2 должны иметь пониженную вязкость HTHS*1 (≤ 3,5 мПа*с) Вязкость SAE 5W-30.

ACEA C3

Масла ACEA C3 являются смазками высшего уровня с низким содержанием SAPS

*2. Они пригодны для использования в высокоэффективных бензиновых и легких дизельных двигателях, где используются передовые системы последующей обработки, такие как дизельные сажевые фильтры (DPF/GPF) и трехступенчатые катализаторы (SCR).

Масла ACEA C3 обычно представляют собой SAE 5W-30 или SAE 5W-40. Масла ACEA C3 должны иметь вязкость HTHS*1 ≥ 3,5 мПа*с.

ACEA C4

Масла ACEA C3 являются смазками высшего уровня с низким содержанием SAPS*2. Они пригодны для использования в высокоэффективных бензиновых и лёгких дизельных двигателях, где используются передовые системы последующей обработки, такие как сажевые фильтры (DPF/GPF) и трёхступенчатые катализаторы (SCR). Масла ACEA C3 обычно представляют собой SAE 5W-30 или SAE 5W-40.

Масла ACEA C4 должны иметь вязкость HTHS*1 ≥ 3,5 мПа*с.

ACEA C5

Масла Спецификации ACEA C5 являются новым дополнением к маслам ACEA 2016. Масла ACEA C5 относятся к высшем уровням смазок с низким содержанием SAPS

*2. Они пригодны для использования в высокоэффективных бензиновых и лёгких дизельных двигателях, где используются передовые системы последующей обработки отработавших газов, такие как дизельные и бензиновые сажевые фильтры (DPF/GPF) и трёхступенчатые катализаторы (SCR).

Масла ACEA C5 имеют пониженную вязкость HTHS*1 ≥ 2,6 и ≤2,9 мПа*с. Вязкость масла SAE 0W-20 или 5W-20.

ACEA 2016 — Европейская спецификация масел для сервисного обслуживания, для бензиновых и дизельных двигателей, с системами доочистки выхлопных газов.
ед. изм.Спецификация
ТребованияС1С2С3С4С5
Вязкость HTHSmPa·s ≥ 2.9 ≥ 2.9
≥ 3.5
≥ 3.5≥ 2.6
Испаряемость (Noack)%≤ 13≤ 13≤ 13≤ 11≤ 13
Щелочное число (TBN)mgKOH/g ≥ 6.0≥ 6.0≥ 6.0
Сера% m/m≤ 0.2≤ 0.3≤ 0.3≤ 0.2≤ 0.3
Фосфор% m/m≤ 0.05≥ 0.07 ≤ 0.09≥ 0.07 ≤ 0.09≤ 0.09≥ 0.07 ≤ 0.09
Сульфатная зольность% m/m≤ 0.5≤ 0.8≤ 0.8≤ 0.5≤ 0.8

Классификация масел по ACEA

E

ACEA E — классификация моторных масел для использования в дизельных двигателях коммерческого транспорта. Об этой классификации в отдельной статье.

Если кто-то изъявит желание совсем подробно изучить спецификацию ACEA 2016 и требования к моторным маслам, то вам будем полезен следующий документ от ACEA.

oil-star.ru – мы предлагаем только качественные масла.


HTHS*1 (High Temperature High Share) — высокотемпературная вязкость при высокой скорости сдвига. Определяется при 150° C. Понижение вязкости HTHS позволяет двигателю сократить потери на трение, а следовательно сократить расход топлива. Масла данной спецификации не являются плохими, из-за снижения вязкости HTHS, но использовать их можно только при условии соответствующей рекомендации изготовителя двигателя. Подробнее о HTHS тут.

SAPS*2 (“Sulphated Ash, Phosphorus and Sulphur”) — аббревиатура переводится как: сульфатная зола, фосфор и сера. Подробнее о SAPS тут.

oil-star.ru – мы предлагаем только качественные масла.

Классификация масел по acea — Полезная информация

Важно!

Если в Интернете вы нашли статью, данные в которой отличаются от этой, обратите внимание на дату ее написания. На момент публикации этой статьи последние изменения в классификации масел по АСЕА датируются 2016 годом. В 2020 информация будет дополнена.

Небольшой экскурс в историю

ACEA — это аббревиатура от французского названия Европейской ассоциации производителей автомобилей. Ее участниками являются такие компании, как BMW Group, Ford, Hyundai, Honda, Toyota, Volkswagen и другие. Стоит ли говорить, что ассоциация с таким авторитетом сможет легко диктовать свои условия рынку? Стандарты, которые она приняла, быстро стали международными.

Заметим, что классификация АСЕА не была первой в своем роде. До нее существовала и активно использовалась спецификация API, разработанная Американским институтом нефти (American Petroleum Institute). Однако технологии производства автомобилей менялись, и между европейскими и американскими машинами стало появляться все больше различий. Стало очевидно, что единый стандарт не может удовлетворять потребностям различных компаний, поэтому в 1996 году с нуля был разработан стандарт АСЕА.

В первой версии спецификации масла для ДВС, работавших на бензине и дизеле, классифицировались отдельно. Это разделение исчезло в 2004 году с выходом обновленной редакции.

Еще одно серьезное изменение, появившееся в спецификации, касалось появления новых классов смазочных материалов (С и Е), которые были разработаны специально для нового поколения двигателей. Изменения стандартов АСЕА производились в 1998, 1999, 2002, 2004, 2007, 2008, 2010, 2012 и 2016 годах. Именно о последней мы говорим сегодня.

Все изменения классификации АСЕА. В первом столбце — год, в котором они были приняты. Во втором — дата, с которой они начали применяться. В третьем — дата, с которой они стали обязательными. В четвертом — дата окончания продаж масел, сертифицированных по данному стандарту.

Важно!

Следующая редакция классификации планировалась на 2018 год, но была перенесена на середину 2020 года. В данной статье мы расскажем о том, какие изменения она предполагает, а с выходом новой спецификации обновим этот материал.

Добавьте страницу в «Закладки», чтобы оставаться в курсе изменений!

Классификация масел по ACEA по состоянию на 2020 год

В актуальной сегодня спецификации, датированной 2016 годом, смазочные материалы делятся на следующие категории:

1. А/В. Пришла на замену существующим раньше категориям А — масла для бензиновых моторов и В — масла для дизельных двигателей. Соответственно, в нее попадают оба типа продуктов. В категории представлено 3 класса масел:

АСЕА А3/В3

Масла со стабильной вязкостью. Данные продукты предназначены для применения в высокофорсированных двигателях. Они используются:

  • в легковых и легких грузовых авто;
  • при длительных интервалах замены смазочных материалов;
  • при постоянном использовании маловязких масел;
  • в транспорте, который эксплуатируется в тяжелых условиях.

АСЕА А3/В4

Масла, которые используются во всех ситуациях, применимых к А3/В3, а также:

  • в высокофорсированных бензиновых двигателях;
  • в дизельных моторах с непосредственным впрыском топлива.

АСЕА А5/В5

Масла со стабильной вязкостью, которые могут применяться:

  • при длительных интервалах замены смазочных материалов;
  • в легковых автомобилях и легких грузовых ТС, работающих на бензине и дизеле, в которых используются масла с вязкостью HTHS от 2.9 до 3.5 мПа*с.

Важно!

Класс АСЕА А1/В1 не используется в классификации ACEA с 2016 года.

2. С. Категория, в которую вошли масла для ДВС, разработанные для соответствия новым европейским экологическим стандартам. Они могут работать в двигателях с сажевыми фильтрами и катализаторами восстановления отработанных газов. В категории С выделяют пять классов:

С1

Масла со стабильной вязкостью с минимальным содержанием SAPS. Допускается их применение

  • в двигателях с катализаторами;
  • в высокофорсированных бензиновых ДВС и в дизельных моторах с непосредственным впрыском топлива, которые используют масла с минимальной вязкостью HTHS 2.9 мПа*с.

С2

Масла со стабильной вязкостью со средним содержанием SAPS. Сфера использования совпадает с С1.

С3

Масла со стабильной вязкостью со средним содержанием SAPS. Сфера использования:

  • в двигателях с катализаторами;
  • в высокофорсированных бензиновых ДВС и в дизельных моторах с непосредственным впрыском топлива, которые используют масла с минимальной вязкостью HTHS 3,5 мПа*с.

С4

Масла со стабильной вязкостью с низким содержанием SAPS. Сфера использования совпадает с С3.

С5

Масла со стабильной вязкостью со средним содержанием SAPS, созданные для уменьшения расхода топлива. Допускается их применение:

  • в двигателях с катализаторами;
  • в высокофорсированных бензиновых ДВС и в дизельных моторах с непосредственным впрыском топлива, в котором допускается применение смазочных материалов с минимальной вязкостью HTHS 2,6 мПа*с.

3. Е. В эту категорию входят масла для дизельных ДВС, эксплуатирующихся в тяжелых условиях, например, при большом интервале замены смазочных материалов. В ней выделяют 4 класса:

Е4

Масло со стабильной вязкостью, которое:

  • обеспечивает чистоту поршней;
  • замедляет износ;
  • предотвращает появление нагара;
  • обеспечивает стабильность смазочного материала.

Допускается применение масла в дизельных двигателях, соответствующих стандартам от Euro I до Euro V и работающих в тяжелых условиях. Также может применяться в моторах без сажевых фильтров и с различными системами уменьшения выхлопов.

Е6

Масла со стабильной вязкостью, отвечающие тем же требованиям, что и E4. Допускается их применение в тех же типах двигателей, а также в моторах, соответствующих стандарту Euro VI. Масла могут применяться вместе с дизельным топливом с пониженным содержанием серы. Данные смазочные материалы могут использоваться в двигателях с системами EGR (с сажевыми фильтрами и без) и SCR.

Е7

Масла со стабильной вязкостью, обеспечивающие чистоту поршней и предотвращающие полировку стенок цилиндров. Отвечают всем требованиям, предъявляемым к классу Е4, и применяются в тех же типах двигателей.

Е9

Масла со стабильной вязкостью, обеспечивающие чистоту поршней и предотвращающие полировку стенок цилиндров. Отвечают всем требованиям, предъявляемым к классу Е4. Подходят для дизельных ДВС, соответствующих стандартам от Euro I до Euro VI. Разрешено использование с топливом с пониженным содержанием серы. Масла могут использоваться в двигателях с системами EGR (с сажевыми фильтрами и без) и SCR.

Это все классы масел, которые вы сможете найти на витринах магазинов. Благодаря указанной классификации вы сможете легко понять, для каких типов моторов они предназначены.

Все масла «Шелл» сертифицированы АСЕА. Вне зависимости от изменений в стандартах мы будем предлагать вам только качественные смазочные материалы.

Обновление ACEA 2020 года

Как мы уже упоминали, оно должно быть принято в середине этого года. Причиной с наибольшей долей вероятности можно считать ужесточение экологического законодательства во всех странах ЕС. Ожидается, что требования к минимальному качеству смазочных материалов в новой классификации будут значительно выше существующих. Это необходимо для того, чтобы они подходили под спецификации нового современного оборудования.

Ожидается, что новые изменения коснутся масел как для легковых, так и для тяжелых грузовых двигателей. Внимание в первую очередь будет направлено на проблемы образования отложений и износа цепей, а также LSPI в турбированных двигателях с непосредственным впрыском.

В результате в 2020 году:

1. Появится класс С6. Для попадания в него масло должно будет успешно пройти все тесты, которые проводятся для С5, а также 3 новых. В результате, по словам представителей АСЕА, между новым и уже существующими классами будет достаточно большая разница.

Важно!

Наименования, которые предлагается использовать в новой классификации, еще не утверждены специалистами. Они могут быть изменены к моменту принятия новых стандартов.

Для того чтобы упростить систему классов, из нее уберут некоторые элементы:

А3/В3

Поскольку эти масла преимущественно используются в старых автомобилях, данный класс более не актуален.

А5/В5

Данный класс будет заменен на А7/В7.

С1

Эти масла не востребованы большинством производителей, поэтому класс более не актуален.

Изменения коснутся и смазочных материалов для тяжелой грузовой техники. В первую очередь они коснутся классов Е6 и Е9, которые будут заменены на Е8 и Е11 соответственно. Это связано с введением в программу оценки новых тестов. Масла классов Е8 и Е11 будут лучше защищать элементы двигателя от окисления и различных отложений. Также рассматриваются возможные изменения вязкости этих продуктов.

Классы Е4 и Е7 останутся без изменений.

В 2020 году ожидается также появление целой новой категории масел для грузовых машин. Предположительно она будет обозначаться литерой F, но по данному вопросу еще ведутся дискуссии. Ожидается, что масла данной категории должны будут снижать расход топлива и обеспечивать лучшую защиту элементов двигателя.

Резюме

АСЕА была и будет одним из основных стандартов для классификации моторных масел. Основываясь на приведенной в статье информации, вы сможете легко найти и выбрать необходимый продукт для своего авто.

При этом стандарты, применяемые для масел, регулярно ужесточаются. Это значит, что любой продукт, сертифицированные АСЕА, соответствует всем требованиям в плане экологии и эффективности.

DIN 51524 — классификация гидравлических масел

Классификации масел и смазок, применяемые для подбора масел для гидравлики.

В России наиболее распространёнными являются следующие классы:
DIN 51524-3 HVLP — масла, которые содержат присадки против коррозии, окисления, износа, а также присадки, которые увеличивают индекс вязкости (индекс вязкости более 140, давление более 100 бар). Масла обозначаются как универсального применения, но наибольший эффект достигается при использовании таких масел в наружных гидравлических системах различной техники.
DIN 51524-2 HLP — масла, содержащие присадки против коррозии, окисления и износа (индекс вязкости превышает 80-100, давление более 100 бар). Масла универсального применения, которые, тем не менее, рекомендуется использовать во внутренних гидравлических системах.
DIN 51524-1 HL — масла, содержащие присадки против коррозии и окисления (индекс вязкости превышает 80-100, давление более 100 бар). Такие масла рекомендуется использовать во внутренних гидравлических системах с относительно невысоким давлением в системе.

Классификация гидравлических масел по ISO 6743 — 4.

ISO — L — HH Минеральные масла, которые не содержат ингибиторов коррозии.
ISO — L — HL Масла класса HH, но с добавленными антиокислительными и антикоррозийными присадками.
ISO — L — HM Масла класса HL, но с добавленными противоизносными присадками.
ISO — L — HR Масла класса HL, но с добавленными более эффективными противоизносными присадками.
ISO — L — HV Масла класса HL, но с высоким индексом вязкости.
ISO — L — HG Масла HM, но с высоким индексом вязкости.
ISO — L — HS Масла HM, но с повышенными свойствами по смягчению ударных нагрузок. Синтетические по составу.

Классификация огнеупорных гидравлических масел ISO 6743 — 4.

ISO — L — HFAE
ISO — L — HFAS
ISO — L — HFB Эмульсия типа «масло в воде». Химические соединения, растворенные в воде.
ISO — L — HFC Водно-жировая эмульсия.
ISO — L — HFDR Вода и гликоли.
ISO — L — HFDS Эфиры фосфорной кислоты — не содержат воды.
ISO — L — HFDT Хлорированные углеводороды — не содержат воды.
ISO — L — HFDU Смеси HFDR / HFDS. Безводные жидкости, более устойчивые, чем HFDR, HFDS или HFDT.

Классификация БР (биологически разлагающихся) гидравлических жидкостей ISO 6743 — 4.

ISO — L — HETG Триглицериды (растительные масла).
ISO — L — HEES Синтетические сложные эфиры типа R-O-R.
ISO — L — HEPG Полигликоли.

Классификация масел для поршневых воздушных компрессоров DIN 51506.

Наиболее распространёнными классами являются:
DIN 51506 VDL — масла, содержащие присадки против коррозии и окисления, температура сжатого воздуха не должна превышать 220ºC. Рекомендуется для компрессоров с двуэтапным сжатием воздуха.
DIN 51506 VCL — масла, содержащие присадки против коррозии и окисления, температура сжатого воздуха не должна превышать 160ºC.
DIN 51506 VBL — масла, содержащие присадки против коррозии и окисления, температура сжатого воздуха не должна превышать 140ºC.

Классификация турбинных масел DIN 51515.

Наиболее распространёнными являются:
DIN 51515-2 L-TG — масла, рекомендованы к применению при температурах, превышающих обычную.
DIN 51515-1 L-TD — масла, рекомендованы к применению в обычном температурном диапазоне.

Классификация редукционных масел DIN 51517.

Наиболее распространённые:
DIN 51517 CGLP — масла, содержащие присадки против коррозии, окисления и износа для применения в местах смешанного трения, а также присадки, улучшающие свойства скольжения поверхностей.
DIN 51517-3 CLP — масла, содержащие присадки против коррозии, окисления и износа для применения в зоне смешанного трения.
DIN 51517-2 CL — масла, содержащие присадки против коррозии и окисления, для применения в условиях средней нагрузки.

Классификация масел для холодильных компрессоров DIN 51503.

Наиболее распространёнными являются:
DIN 51503 KA — масла, пригодные для использования в системах охлаждения с аммиаком.
DIN 51503 KC — масла, пригодные для использования в системах охлаждения с хлорированными фреонами.

Классификация пластичных смазок DIN 51825.

Наиболее распространёнными являются:
DIN 51825 K — смазка, изготовленная из минерального и / либо синтетического масла высокой вязкости, с прменением загустителя.
DIN 51825 KP — смазка класса K с дополнительными присадками, снижающими трение и защищающими от износа, для применения в зоне смешанного трения.
DIN 51825 KF — смазка класса K с дополнительными твёрдыми присадками (графит, дисульфид молибдена и т.д.).
DIN 51825 KPF — смазка класса K с дополнительными присадками, снижающими трение и защищающими от износа в зоне смешанного трения, а также с дополнительными твёрдыми присадками (графит, дисульфид молибдена и т.д.).

Классификация моторных масел

Классификация моторных масел.

Первые стандарты и классификации моторных масел появились уже в началае ХХ века – во времена легендарного Ford T. В процессе развития и совершенствования автомобильных двигателей, изменялись и требования к маслам, которые отражались в соответствующих спецификациях. Сегодня в автомобильном мире существует два общих стандарта классификации моторных масел – американский API и европейский ACEA, а также множество фирменных допусков автопроизводителей.

Стандарт ACEA применяется для классификации моторных масел в Европе. Ввиду наличия множества фирменных допусков автопроизводителей, является достаточно общим и во многом базовым для них. Используется азиатскими автопроизводителями, работающими на европейском рынке. В Северной Америке не применяется.

Стандарт API (American Petroleum Institute) является действующим стандартом классификации моторных масел в Северной Америке. Разработан совместно с ASTM (American Society for Testing and Materials) и SAE (Society of Automobile Engineers). Свое распространение в Азии получил благодаря истории развития японского, корейского и китайского автомобилестроения. В Европе не применяется.

Стандарт ILSAC действующий стандарт, внедренный и развиваемый международным комитетом по стандартизации и апробации моторных масел (ILSAC- International Lubricant Standardization and Approval Committee). Комитет был создан американской и японской ассоциями производителей автомобилей ААМА и JAMA. Распространен у американских, японских и корейских автопроизводителей.

В связи с тем, что в Европе и Америке применяются различные, хотя и во многом очень схожие сегодня стандарты, масла для европейского рынка зачастую не имеют действующих омологаций API, а масла для американского рынка – омологаций ACEA даже если продукт в действительности соответствует или превосходит требования стандарта.

Классификация ACEA
Европейский стандарт ACEA предъявляет более высокие требования к маслам, нежели стандарт API тех же лет. Согласно классификации ACEA, моторные масла делятся на три класса. Класс A/B: для бензиновых и дизельных двигателей легковых автомобилей и легкой коммерческой техники; Класс C: масла со сниженной зольностью (Low SAPS — Sulfated Ash, Phosphorus, Sulphur) для бензиновых и дизельных двигателей легковых автомобилей и легкой коммерческой техники с дополнительными системами нейтрализции отработанных газов, в том числе с системами EGR, многоступенчатыми катализаторами, сажевыми фильтрами; Класс E: для тяжелых грузовых автомобилей, строительной техники и т.п. В классификации ACEA, в отличии от американской API, название класса масла не меняется при изменении требований к свойствам масел или методике тестирования. Изменения отражаются в маркировке класса по годам (например, A3-04/B4-04).

Отличие бензиновых и дизельных масел
В легких бензиновых и дизельных двигателях применяются одинаковые масла поэтому масла классов A и B (для легких бензиновых и легких дизельных двигателей) объединены в один класс и идут в паре (A/B).

Масла класса ACEA A/B для бензиновых и дизельных двигателей

 Класс 
Применение

А1/В1

Маловязкие энергосберегающие масла со сниженной вязкостью HTHS (HTHS >2,6 мПа*с для масел вязкостью SAE xW-20 и от 2,9 до 3,5 мПа*с для остальных классов вязкости)
Такими маслами являются: Aral HighTronic F 5W-30

А3/В3

Для двигателей, работающих в тяжелых условиях либо с удлиненными межсервисными интервалами, в том числе с турбонаддувом.  Стандартная вязкость HTHS >3,5 мПа*с.
Такими маслами являются: Aral MegaTronic 10W-60  Aral HighTronic M 5W-40  Aral SuperTronic G 0W-30

А3/В4

Для двигателей, работающих в тяжелых условиях либо с удлиненными межсервисными интервалами, в том числе с турбонаддувом и непосредственным впрыска топлива, насос-форсунками или системой Common Rail. Стандартная вязкость HTHS >3,5 мПа*с.
Такими маслами являются: Aral HighTronic 5W-40  Aral HighTronic M 5W-40  Aral SuperTronic G 0W-30  Aral SuperSynth 0W-40  Aral BlueTronic 10W-40

А5/В5

Маловязкие энергосберегающие масла для двигателей, работающих в тяжелых условиях либо с удлиненными межсервисными интервалами, в том числе с турбонаддувом. Пониженная вязкость HTHS 2,9 – 3,5 мПа*с.
Такими маслами являются: Aral SuperTronic E 0W-30  Aral HighTronic F 5W-30

Масла класса ACEA С со сниженной зольностью для бензиновых и дизельных двигателей

Класс 
Применение

C1

Маловязкие энергосберегающие масла со сниженным показателем вязкости HTHS от 2,9 мПа*с. Низкая зольность. Для двигателей с современными системами нейтрализации отработанных газов.
Такими маслами являются: Aral HighTronic C 5W-30

C2

Маловязкие энергосберегающие масла со сниженной HTHS. Средняя зольность. Для двигателей с современными системами нейтрализации отработанных газов.  Пониженная вязкость HTHS от 2,9 мПа*с.
Такими маслами являются: Aral SuperTronic 0W-40  Aral HighTronic J 5W-30

C3

Для двигателей современными системами нейтрализации отработанных газов, работающих в тяжелых условиях либо с удлиненными межсервисными интервалами, в том числе с турбонаддувом. Низкая и средняя зольность. Стандартная вязкость HTHS >3,5 мПа*с.
Такими маслами являются: Aral SuperTronic 0W-40  Aral SuperTronic Longlife III 5W-30  Aral HighTronic G 5W-30

C4

Для двигателей с современными системами нейтрализации отработанных газов, в том числе с турбонаддувом. Низкая зольность. Стандартная вязкость HTHS >3,5 мПа*с.
Такими маслами являются: Aral HighTronic R 5W-30

Масла класса АСЕА Е для грузовых автомобилей

 Класс 
Применение

E1

Для дизельных двигателей без турбонаддува, работающих в легких условиях со стандартными интервалами замены. По свойствам соответствуют спецификации MB 227.1;
Класс отменен в 1998 году.

E2

Для слабонагруженных дизельных двигателей без сажевых фильтров, систем рециркуляции со стандартными интервалами замены. По свойствам соответствует спецификациям MB 228.1, MAN 271.
Класс отменен в 2007 году.
Таким маслом является:
Aral Traktoral 10W-40

E3

Для дизельных двигателей без сажевых фильтров и систем рециркуляции, работающих, в том числе, в тяжелых условиях и с удлиненными интервалами замены.
Класс отменен в 2002 году

Е4

Для высокооборотистых дизельных двигателей экологических классов Euro I, Euro II и Euro III (без сажевых фильтров), работающих, в том числе, в тяжелых условиях и с удлиненными интервалами замены. Высокая зольность, хорошие антиокислительные свойства.
Такими маслами являются: Aral SuperTurboral 5W-30  Aral MegaTurboral 10W-40

E5

Для высокооборотистых дизельных двигателей экологических классов Euro I, Euro II и Euro III (без сажевых фильтров), работающих, в том числе, в тяжелых условиях и с удлиненными интервалами замены. От масел класса Е4 отличается соответствием более строгим требованиям, выдвигаемым американскими стандартами API.
Класс отменен в 2002 году
Таким маслом является: Aral Turboral 10W-40

Е6

Соответствует классу E4, однако, с ограничениями по зольности. Для дизельных двигателей экологических классов Euro I — Euro V, в том числе оснащенных системами рециркуляции EGR, снижения выбросов оксидов азота и сажевыми фильтрами.
Такими маслами являются: Aral SuperTurboral LA 5W-30  Aral MegaTurboral LA 10W-40

Е7

Для дизельных высокооборотистых двигателей экологических классов Euro I — Euro IV с системами рециркуляции (EGR) и снижения выбросов оксидов азота, без сажевых фильтров, работающих, в том числе, в тяжелых условиях и с удлиненными интервалами замены. Улучшенные антиокислительные и моющие свойства.
Такими маслами являются: Aral SuperTurboral 5W-30  Aral SuperTurboral LA 5W-30  Aral MegaTurboral 10W-40  Aral MegaTurboral LA 10W-40  Aral MegaTurboral S 10W-40

Е9

Соответствует классу E7, однако, с ограничениями по зольности. Для дизельных двигателей экологических классов Euro I — Euro V, в том числе оснащенных системами рециркуляции EGR и снижения выбросов оксидов азота, а также сажевыми фильтрами.
Такими маслами являются: Aral MegaTurboral VR 10W-40

Классификация API
Исторически в Америке легковые автомобили и легкие грузовики (траки) комплектуются исключительно бензиновыми двигателями. Дизеля же являются уделом исключительно тяжелой техники. Поэтому в классификации API моторные масла разделяются на две крупные категории: S (Service) для бензиновых двигателей и C (Commercial) для дизельных моторов коммерческой техники.

Масла стандарта API S для бензиновых двигателей

 Класс 
Статус
Применение

SN

 Действующий 

Представлен в октябре 2010 года.
Основные характеристики: улучшенная защита поршней от высокотемпературных отложений, более строгие требования к шламообразованию, улучшенная совместимость с уплотняющими деталями двигателя, ограничение содержания фосфора.
Требования к энергосберегающим (FE- fuel economy) маслам класса API SN соответствуют требованиям стандарта ILSAC GF-5: лучшая топливная экономичность, защита турбонагнетателей, систем уменьшения токсичности выхлопа, повышенная стойкость при использовании в двигателях на этанол-содержащем бензине вплоть до E85.
Масла API SN близки по свойствам  с маслами АСЕА С с поправкой на высокотемпературную вязкость HTHS.
Такими маслами являются: Aral HighTronic 5W-40  Aral HighTronic M 5W-40  Aral SuperTronic 0W-40 • Aral HighTronic G 5W-30

SM

Действующий

Введен в 2004 году. В сравнении с предыдущим накладывает дополнительные требования на антиокислительные, моющие свойства масла и его ресурс. Появляется понятие энергосберегающих масел.
Для двигателей, выпущенных до 2010 года.

SL

Действующий

Введен в 2001 году. Основные характеристики: повышенная (в сравнении с SJ) защита от износа, улучшение топливной экономичности, снижение количества выброса вредных веществ, увеличенные сервисные интервалы. Ужесточены методики тестирования. Для двигателей, выпущенных до 2004 года.
Такими маслами являются: Aral SuperTronic E 0W-30 • Aral SuperTronic G 0W-30 • Aral HighTronic F 5W-30 • Aral BlueTronic 10W-40 • Aral Turboral 10W-40

SJ

Действующий

Введен в 1996 году. Более жесткие требования (в сравнении с SH) к выбросам вредных веществ.
Для двигателей, выпущенных до 2001 года.

SH

Устаревший

Введен в 1993 году. Основные требования соответствуют классу SG, однако ужесточена методика тестирования.
Для двигателей, выпущенных до 1996 года.

SG

Устаревший

Масла не предназначены для применения в большинстве бензиновых двигателей, выпущенных после 1993 года. Могут не обеспечивать необходимую защиту от износа, шламообразования, имеют сниженное противодействие окислению.

SF

Устаревший

Масла не предназначены для применения в большинстве бензиновых двигателей, выпущенных после 1988 года. Могут не обеспечивать необходимую защиту от шламообразования.

SE

Устаревший

Масла не предназначены для применения в большинстве бензиновых двигателей, выпущенных после 1979 года.

SD

Устаревший

Масла не предназначены для применения в большинстве бензиновых двигателей, выпущенных после 1971 года. Применение в современных двигателях может привести к падению характеристик и повреждению двигателя.

SC

Устаревший

Масла не предназначены для применения в большинстве бензиновых двигателей, выпущенных после 1967 года. Применение в современных двигателях может привести к падению характеристик и повреждению двигателя.

SB

Устаревший

Масла не предназначены для применения в большинстве бензиновых двигателей, выпущенных после 1951 года. Применение в современных двигателях может привести к падению характеристик и повреждению двигателя.

SA

Устаревший

Масла не содержат присадок. Масла не предназначены для применения в большинстве бензиновых двигателей, выпущенных после 1930 года. Применение в современных двигателях приведет к падению характеристик и повреждению двигателя.

Масла стандарта API C для дизельных двигателей

 Класс 
Статус
Применение

CJ-4

 Действующий 

Для высокооборотистых 4-тактных двигателей, соответствующих дорожному стандарту экологичности 2010 года и внедорожному стандарту Tier 4. Масла для применения в автомобилях с современными системами нейтрализации отработанных газов (в том числе сажевыми фильтрами DPF). Содержание серы в топливе менее 0,05% (500 ppm). Применение масел этого класса с топливом с содержанием серы более 0,0015% (15 ppm) не рекомендуется. Повышенные защита от износа и отложений на поршнях, термостабильность, улучшенные антиокислительные свойства.
Превосходят масла классов API CI-4, CI-4 PLUS, CH-4, CG-4 и CF-4.
Таким маслом является: Aral MegaTurboral VR 10W-40

CI-4

Действующий

Представлен в 2002 году. Для высокооборотистых 4-тактных двигателей, соответствующих стандарту экологичности 2004 года (представлен в 2002 году). Для использования в двигателях с системой рециркуляции отработанных газов (EGR). Содержание серы в топливе менее 0,5%. Превосходят масла классов CD, CE, CF-4, CG-4 и CH-4. Некоторые масла класса CI-4 также соответствуют классу CI-4 PLUS.
Такими маслами являются: Aral SuperTurboral LA 5W-30  Aral MegaTurboral LA 10W-40  Aral Turboral 10W-40

CH-4

Действующий

Представлен в 1998 году. Для высокооборотистых 4-тактных двигателей, соответствующих стандарту экологичности 1998 года. Содержание серы в топливе менее 0,5%. Превосходят масла классов CD, CE, CF-4 и CG-4.
Такими маслами являются: Aral MegaTurboral S 10W-40

CG-4

Устаревший

Представлен в 1995 году. Для высокооборотистых 4-тактных двигателей, работающих в тяжелых условиях и соответствующих экологическим нормам 1994 года. Содержание серы в топливе менее 0,5%. Превосходят масла классов CD, CE и CF-4.

CF-4

Устаревший

Представлен в 1990 году. Для высокооборотистых 4-тактных двигателей, в том числе с турбонаддувом. Масла этого класса могут применяться вместо масел классов CD и CE.
Таким маслом является: Aral Traktoral 10W-40

CF-2

Устаревший

Представлен в 1994 году. Для 2-тактных дизельных двигателей, работающих в тяжелых условиях. Масла этого класса могут применяться вместо масел класса CD-II.

CF

Устаревший

Представлен в 1994 году. Для форкамерных двигателей, двигателей, работающих в тяжелых условиях и на топливе с содержанием серы более 0,5%. Масла этого класса могут применяться вместо масел класса CD.

CE

Устаревший

Масла не предназначены для применения в большинстве дизельных двигателей, выпущенных после 1994 года. Применение в современных двигателях может привести к падению характеристик и повреждению двигателя.

CD-II

Устаревший

Масла не предназначены для применения в большинстве дизельных двигателей, выпущенных после 1994 года. Применение в современных двигателях может привести к падению характеристик и повреждению двигателя.

CD

Устаревший

Масла не предназначены для применения в большинстве дизельных двигателей, выпущенных после 1994 года. Применение в современных двигателях может привести к падению характеристик и повреждению двигателя.

CC

Устаревший

Масла не предназначены для применения в большинстве дизельных двигателей, выпущенных после 1990 года. Применение в современных двигателях может привести к падению характеристик и повреждению двигателя.

CB

Устаревший

Масла не предназначены для применения в большинстве дизельных двигателей, выпущенных после 1961 года. Применение в современных двигателях может привести к падению характеристик и повреждению двигателя.

CA

Устаревший

Масла не предназначены для применения в большинстве дизельных двигателей, выпущенных после 1959 года. Применение в современных двигателях может привести к падению характеристик и повреждению двигателя.

Масла стандарта ILSAC
Стандарт ILSAC был разработан совместно американскими и японскими автопроизводителями для классификации маловязких моторных масел, применяемых в современных бензиновых двигателях. Все масла класса ILSAC имеют сниженную высокотемпературную вязкость HTHS. На сегодняшний день масла класса ILSAC разделены на 6 классов. Каждый следующий класс предъявляет к свойствам масел новые более строгие требования либо расширяет диапазон возможных вязкостей (как правило, в сторону более жидких масел).

Масла стандарта ILSAC

 Класс 

Статус

Применение

GF-6

Будущий

Класс GF-6 должен быть представлен в 2017 году. Ожидается, что GF-6  будет разделен на два подкласса: ILSAC GF-6A и ILSAC GF-6B.
Масла класса GF-6A будут обеспечивать лучшие защиту двигателя, топливную экономичность и стабильность характеристик по сравнению с GF-5. Значение HTHS от 2.6 мПа*с.
Масла класса GF-6B по комплексу характеристик обеспечат те же свойства, что и GF-6A, однако будут обладать еще более низкой высокотемпературной вязкостью HTHS. Также появятся масла вязкостью ниже 0W-20.

GF-5

Действующий

Представлен в 2010 году. Масла стандарта GF-5 должны обеспечивать лучшую защиту поршней от высокотемпературных отложений и лучшую защиту турбонагнетателей, иметь более высокую совместимость с уплотняющими деталями двигателя, повышенную стойкость при использовании в двигателях на этанол-содержащем бензине вплоть до E85. Также более строгие требования к шламообразованию. Превосходит GF-1, GF-2, GF-3 и GF-4.

GF-4

Устаревший

Стандарт GF-4 идентичен API SM, но требует прохождения дополнительных тестов на топливную экономичность VIB Fuel Economy Test (ASTM D6837).
Превосходит GF-1, GF-2 и GF-3.
Таким маслом является: Aral HighTronic F

GF-3

Устаревший

Масла стандарта GF-3 должны соответствовать требованиям стандарта API SL и директивы EC-II. Дополнительные требования к стойкости пакета присадок, противодействию угару, склонности к отложениям в двигателе, влиянию масла на системы нейтрализации отработанных газов, топливной экономичности.
Превосходит GF-1 и GF-2.

GF-2

Устаревший

Представлен в 1996 году. Масла стандарта GF-2 должны соответствовать требованиям стандарта API SJ и директивы EC-II. Дополнительные требования к зольности, низкотемпературным свойствам, высокотемпературной стабильности и пенообразованию. Допустимые вязкости: 0W-30, 0W-40, 5W-20, 5W-30, 5W-40, 5W-50, 10W-30, 10W-40 и 10W-50.
Превосходит GF-1.

GF-1

Устаревший

Представлен в 1990 году, в 1992 году были внесены правки. Масла стандарта GF-1 должны соответствовать требованиям стандарта API SH и директивы Energy Conserving II (EC-II). Представляет собой базовые требования к маслам для американских и японских автопроизводителей.

Классификация моторных масел по API

Моторное масло, которое мы используем в своем автомобиле, состоит из базового масла и присадок. На заводе производителя эти компоненты смешиваются между собой при нагреве. Базовые масла и присадки подбираются в специальной пропорции, чтобы соответствовать необходимым спецификациям, требованиям автопроизводителя.

Чаще всего базовые масла разделяют на три группы: синтетика, полусинтетика и минеральное масло, но фактически этих групп пять. Согласно классификации американского института нефти API эти группы отличаются между собой по трём показателям: содержанию серы, содержанию насыщенных углеводородов и индексу вязкости.

• Сера вызывает коррозию метала, при сгорании сернистых соединений образуются кислоты, которые вызывают окисление. Наличие серы негативно отражается на свойствах базового масла.

• Насыщенные углеводороды – по сравнению с ненасыщенными, более стабильны и окисляются медленнее. Чем больше их содержание, тем медленнее базовое масло окисляется, стареет и деградирует.

• Индекс вязкости – это величина, которая характеризует зависимость вязкости масла от температуры. Вязкость масел с высоким индексом вязкости в меньшей степени зависит от температуры, отсюда значительно улучшаются низкотемпературные свойства масла. Следовательно, чем выше индекс вязкости масла, тем лучше его свойства.


I и II группа базовых масел – это минеральные масла. Первая группа имеет низкую степень очистки и высокое содержание серы и азота, вследствие чего, быстро окисляется. Поэтому, 1-я группа имеет низкие эксплуатационные свойства и не используется в продукции IDEMITSU. Степень очистки второй группы выше по сравнению с первой, выше и эксплуатационные свойства. Но по сравнению с синтетическими маслами они всё же недостаточно высоки.

Полусинтетические масла – это чаще всего смесь II и III группы, у некоторых производителей I и III.

Масла III, IV и V группы – синтетические.

Третья и четвертая группы имеют сходные эксплуатационные свойства:

Высокий индекс вязкости по сравнению с I и II группами, лучше низкотемпературные и пусковые свойства.

Содержание насыщенных углеводородов практически 100%, лучше термокислительная стабильность, они медленнее окисляются, медленнее деградируют и стареют, срок их службы выше по сравнению с I и II.

Летучесть III и IV групп ниже по сравнению с I и II.

Благодаря этим свойствам, расход синтетических масел меньше, а также у синтетических масел более стабильные вязкостные характеристики в длительном интервале эксплуатации.

У III и IV групп более низкий коэффициент трения и выше смазывающие свойства, связано это с тем, что в III и IV группе молекулы однородные, размер молекул соизмерим, достигается это за счет применения технологий синтеза, а в I и II молекулы разного размера, т.к. это технология очистки.

Пятая группа масел используется преимущественно в промышленности и редко используется в автоиндустрии. Третья и четвертая группы, наоборот, получили здесь широкое применение.

классификации моторных масел

Мы уже обсуждали некоторые организации, которые классифицируют смазочные материалы. Теперь, когда мы знакомы с ними, давайте рассмотрим некоторые из их стандартов и классификаций. Помните, всегда проверяйте руководство пользователя, чтобы определить, какую смазку вам следует рассмотреть.

Классификация API, бензин

SA — Устаревший, не подходит для двигателей, построенных после 1930 года.

SB — Устаревший, не подходит для двигателей, построенных после 1951 года.

SC — Устаревший, не подходит для двигателей, построенных после 1967 года.

SD — Устаревший, не подходит для двигателей, построенных после 1971 года.

(ВНИМАНИЕ: смазочные материалы этой классификации могут вызвать повреждение современных двигателей)

SE — Устаревший, не подходит для двигателей, построенных после 1979 года.

SF — Устаревший, не подходит для двигателей, построенных после 1988 года.

SG — Устаревший, не подходит для двигателей, построенных после 1993 года.

SH — Вышло из употребления, не подходит для двигателей, построенных после 1996 года.

(ПРЕДУПРЕЖДЕНИЕ: смазочные материалы этой классификации могут не обеспечивать адекватную защиту от образования отложений)

SJ — Текущая версия, для двигателей 2001 года и старше

SL — Текущая, для двигателей 2004 года и старше

SM — Текущая, для двигателей 2010 года и старше

SN — Текущая, введена в 2010 году.

Классификация API, коммерческое дизельное топливо

CA — Устаревший, устаревший, не подходит для двигателей, построенных после 1959 года.

CB — Устаревший, не подходит для двигателей, выпущенных после 1961 года.

CC — Устаревший, не подходит для двигателей, построенных после 1990 года.

CD — Устаревший, не подходит для двигателей, построенных после 1994 года.

CD II — Устаревший, не подходит для двигателей, выпущенных после 1994 года.

CE — Устаревший, не подходит для двигателей, выпущенных после 1994 года.

CF — Устаревший, не подходит для двигателей, построенных после 1994 года.

CF -2 — Устаревший, не подходит для двигателей, выпущенных после 2009 года. Обратитесь к производителю за рекомендациями по двухтактным двигателям

CF-4 — Устаревший, не подходит для двигателей, выпущенных после 2009 года.

CG — 4 — Устарело, не подходит для двигателей, построенных после 2009 года.

CH-4 — Текущие, для высокоскоростных четырехтактных двигателей, разработанные в соответствии со стандартами выбросов выхлопных газов

CI-4 — Текущие, введены в 2002 году.Для высокоскоростных четырехтактных двигателей, соответствующих нормам выбросов 2002 года. Разработано для обеспечения долговечности двигателя при использовании системы рециркуляции выхлопных газов (EGR) и предназначено для использования с дизельным топливом с содержанием серы до 0,5% по весу. Также может квалифицироваться как CI-4 PLUS.

CJ — 4 — Current, Для высокоскоростных четырехтактных дизельных двигателей, разработанных в соответствии со стандартами 2010 г. на выбросы выхлопных газов на шоссе и 4 уровня для внедорожных транспортных средств. Разработано для использования во всех сферах применения с дизельным топливом с содержанием серы до 500 ppm (0.05% по весу). Использование этих масел с содержанием серы более 15 ppm (0,0015% по весу) может повлиять на срок службы системы нейтрализации выхлопных газов и интервал замены. Проконсультируйтесь с производителем, если используете масло с концентрацией выше 15 ppm.

CK — 4 — Current, Для высокоскоростных четырехтактных дизельных двигателей, разработанных в соответствии со стандартами 2017 года по выбросам выхлопных газов на шоссе и 4 уровня для внедорожных транспортных средств. Разработано для использования во всех сферах применения с дизельным топливом с содержанием серы до 500 частей на миллион (0,05% по весу).Использование этих масел с содержанием серы более 15 ppm (0,0015% по весу) может повлиять на срок службы системы нейтрализации выхлопных газов и интервал замены. Проконсультируйтесь с производителем, если используете масло с концентрацией выше 15 ppm.

API, дизельное топливо

FA — 4 — Текущая категория обслуживания API FA-4 описывает определенные масла XW-30, специально разработанные для использования в избранных высокоскоростных четырехтактных дизельных двигателях, разработанных для работы в 2017 модельном году. стандарты выбросов парниковых газов (ПГ) на дорогах.Эти масла разработаны для использования на автомагистралях с содержанием серы в дизельном топливе до 15 частей на миллион (0,0015% по весу). См. Рекомендации производителя двигателя относительно совместимости с маслами API FA-4. Эти масла смешаны в диапазоне вязкости при высоких температурах и высоком сдвиге (HTHS) от 2,9 до 3,2 сП, что способствует снижению выбросов парниковых газов.

Категории ILSAC

ILSAC GF 1 — Масло соответствует требованиям API SH и Energy Conserving II (EC-II), минимальным требованиям для масел.

ILSAC GF 2 — Масло должно соответствовать требованиям API SJ и EC-II. Масла должны соответствовать требованиям по содержанию фосфора, работе при низких температурах и контролю пенообразования при высоких температурах.

ILSAC GF 3 — Масло должно соответствовать стандартам API SL и EC — II. Этот стандарт имеет более строгие параметры в отношении долгосрочного воздействия на выхлопные системы транспортных средств и повышения топливной экономичности и летучести. Это также требует меньшего разрушения присадок и меньшего расхода масла.

ILSAC GF 4 — Аналогичен API SM, но требует дополнительных испытаний на экономию топлива.

ILSAC GF 5 — Ток, дополнительная защита от отложений при высоких температурах в поршнях и турбонагнетателях. Также отвечает более строгим требованиям по контролю за образованием осадка, совместимости с контролем выбросов, совместимости с уплотнениями и экономии топлива.

Понимание классификации масел

— 13 октября 1995 г.

Q: В моем руководстве по эксплуатации Mercury 1992 года указано, что масло имеет маркировку «API-SERVICE SG.«В нем говорится, что нельзя использовать API SF, но разрешено использовать API SF, SG. В нем также говорится, что нельзя использовать масло без моющих присадок или масла с маркировкой API SA, SB, SC, SD или SE. У меня есть полдюжины бутылок масла здесь, дома. Все они говорят что-то разное. Как я могу определить, какое масло является моющим средством? Что означают все эти буквы? Можно ли использовать одну марку масла с одной заменой масла, а другую марку — с при следующей замене масла, если у них одинаковые буквы? Можно ли доливать масло другой марки? Какие проблемы (если есть) могут возникнуть, если вы поменяете марку масла? — Р.O., Bremerton

A: Письма, о которых вы спрашиваете, относятся к сервисной классификации масла API. Я вспомнил, как недавно изменились рейтинги масел в связи с изменениями в автомобильной технологии, но только когда я прочитал публикации, предоставленные мне Kendall Motor Oil Company и Texaco Lubricants, я понял, насколько быстрыми были эти изменения.

В 1947 году Американский институт нефти (API) разработал рейтинговую систему, которая установила три типа моторных масел: обычные, премиальные и тяжелые.Пять лет спустя API в сотрудничестве с Американским обществом испытаний и материалов (ASTM) добавил систему классификации услуг, которая учитывала тип двигателя, для которого было смешано масло. Например, масло MS было маслом, подходящим для использования в двигателях с искровым зажиганием в «самых тяжелых» (MS) условиях эксплуатации. Эта система проработала следующие 23 года.

Затем, в 1970 году, API, ASTM и Общество автомобильных инженеров (SAE) разработали открытую систему классификации услуг, чтобы при необходимости можно было вносить дополнения.Было решено иметь две основные категории: масла «S» для двигателей с искровым зажиганием (например, бензиновых) и масла C для двигателей с воспламенением от сжатия (например, дизельных). Впервые классификации были также привязаны к конкретным процедурам тестирования и уровням производительности. В 1970 году все существующие масла могли быть охвачены четырьмя классификациями S (SA SD) и четырьмя классификациями C (CA CD). С тех пор количество классификаций API почти удвоилось.

Чем ближе вторая буква рейтинга API к концу алфавита, тем строже предъявляются требования к производительности.Масла SA и SB (если вы даже можете их найти) не следует использовать больше, если это специально не рекомендовано. Масло SC было разработано для двигателей, произведенных с 1964 по 1967 год, SD для двигателей, произведенных с 1968 по 1971 год, SE с 1972 по 1979 год, SF с 1980 по 1989 год, SG с 1989 по 1993 год и SH с 1994 по настоящее время. Масла с более высоким классом эксплуатации могут быть заменены на масла с более низким классом, но не наоборот. Масла с рейтингом SG не рекомендуются для двигателей, разработанных в соответствии со спецификациями масел SC и SD.

Надеюсь, в колонке на следующей неделе я отвечу на остальные ваши вопросы.

(Чип Кин является сертифицированным ASA техническим специалистом по автомобильной промышленности и владельцем ремонтной мастерской Hansville. Читатели могут отправлять вопросы по адресу: Car Forum, The Sun, почтовый ящик 259, Bremerton 98337 или по электронной почте [email protected] .)

Классификация промышленных масел | Valvoline Europe

Индустриальные масла и смазки играют важную роль в любой отрасли.Они применяются для повышения производительности промышленных машин и оборудования, а защищают их от повреждений во время эксплуатации. Существуют различные типы индустриальных масел, и их классификация основана на их происхождении и составе. Более того, эти точки также определяют некоторые из наиболее важных свойств масла. Вместе с системой добавок, используемых в их рецептурах, они дополнительно влияют на их применение.

Что касается промышленного применения, жидких смазочных материалов используются во всех существующих отраслях промышленности .Будь то отрасль, работающая в тяжелых условиях и на местности, или отрасль с высокими требованиями к безопасности процессов и продукции, промышленные смазочные жидкости найдут применение в тяжелых условиях эксплуатации .

Хорошо спланированная система смазки с использованием высокоэффективных смазочных материалов может дать множество преимуществ.

Говоря о классификации масел, вот что вам нужно знать.

Важные свойства масла

Масла в жидкой форме можно разделить на на три основные категории .Прежде чем мы поговорим об этих категориях более подробно, важно понять, каковы наиболее важные свойства масла.

Вязкость

Вязкость — важнейшая характеристика индустриальных масел. Он выражается индексом вязкости (VI), который представляет собой степень чувствительности вязкости смазочного материала к изменениям температуры. Высокий индекс вязкости указывает на то, что смазочный материал более стабилен при различных температурах, как высоких, так и низких.

Температура застывания

Другой важной особенностью жидких смазочных материалов является их способность течь при низких температурах или температура застывания.Другими словами, это температура, при которой смазочное масло не замерзает, а продолжает течь . Следовательно, возможность смазки при экстремальных внешних температурах.

Температура вспышки

Температура вспышки индустриального масла — это температура, при которой его пары или смесь паровоздушного масла могут загореться или сгореть . Он служит индикатором пожаро- и взрывоопасности масел и топлива при хранении и транспортировке.

Различные типы масел — классификация базовых масел

Как упоминалось выше, существует три типа жидкого масла — натуральное, минеральное, и синтетическое масло .

Масла натуральные

В первую категорию входят натуральные масла, полученные из натуральных источников без чрезмерной обработки. Кроме того, эти жидкие смазочные материалы получают из животных жиров и овощей, таких как рапсовое и касторовое масла.

По своим свойствам натуральные масла являются довольно нестабильными продуктами в окислительных и термических средах. Кроме того, они легко окисляются при высоких температурах, что приводит к потере их свойств. По этим причинам мы не используем натуральные масла для машинной смазки.

Минеральные масла

Минеральные масла — это смазочные материалы, полученные из нефтепродуктов , которые добываются из нефтяных скважин, также известных как нефтяники. По своему составу все минеральные масла представляют собой углеводороды или органические соединения, состоящие из водорода и углерода.

После того, как нефть извлекается из нефтяной скважины, она проходит через различные процессы фракционирования . В ходе этих процессов получают масла и топливо с различными свойствами, такими как вязкость.Продукты с более высокой вязкостью и смазывающими свойствами используются как смазочные вещества или масла. Важно отметить, что минеральные масла очень чувствительны к изменениям температуры и обычно имеют индекс вязкости до 120. Их температура застывания находится в диапазоне от -6 ℃ до -60 ℃, однако большинство минеральных масел имеют — Температура застывания 20 ℃. Кроме того, минеральные масла легко горят, что означает, что они имеют более низкие температуры воспламенения.

Поскольку они происходят из природных ресурсов, они содержат другие элементы, такие как сера, фосфор, азот и другие.Эти элементы рассматриваются как примесей , которые влияют на смазку и загрязняют окружающую среду. Они могут вызвать образование шлама и отложений, которые возникают как продукты окисления и других реакций, протекающих в процессе смазки. По этим причинам минеральные масла должны пройти процесс очистки . После очистки минеральные масла дополняются присадками для компенсации их недостатков. Тем не менее, минеральных масел используются в промышленности в наибольшем количестве .

Масла синтетические

Синтетические масла были разработаны как ответ на некоторые недостатки применения минеральных масел. Минеральные масла имеют определенные ограничения в применении. Как нефтепродукты, они содержат примеси, влияющие на их характеристики. Вот почему синтетические масла производятся с помощью химических процессов для создания более совершенной альтернативы минеральным или традиционным жидким смазочным материалам.

Являясь синтетическими нефтепродуктами, синтетические индустриальные масла обладают рядом положительных свойств.В отличие от минеральных масел, синтетические смазочные жидкости не содержат примесей, которые уменьшают или исключают возможность образования отложений и делают их стабильными продуктами. Кроме того, они имеют гораздо более высокий индекс вязкости, что делает их стабильными при различных температурах. Поскольку их температура застывания находится в диапазоне температур от -18 ℃ до -74 ℃ (обычно от -30 до -50 ℃), их текучесть при низких температурах улучшается. Что-то, что делает их идеальными для применений в отраслях, где пожар считается серьезной опасностью, — это их более высокая температура воспламенения, которая достигает уровня негорючести.

Судя по всем свойствам синтетических масел, они отлично подходят для:

  1. Применение при высоких и низких температурах (лучший индекс вязкости),
  2. Применения, требующие масла с низкой воспламеняемостью,
  3. Ситуации, когда необходимо обратить внимание на совместимость с высокопористыми материалами, такими как резина или пластик,
  4. Применения, в которых загрязнение серой и фосфором считается серьезной опасностью, например, пищевая промышленность.

Хотя синтетические масла кажутся идеальными смазочными материалами, они имеют один недостаток по сравнению с минеральными маслами. В отличие от минеральных масел, они не подходят для граничных смазок. Другими словами, они имеют на более низкие смазочные свойства , поскольку они не уменьшают трение и не изнашивают так же эффективно, как минеральные масла . Тем не менее, это компенсируется введением в их состав присадок, что делает их очень хорошими индустриальными маслами.

Добавки разные

Промышленные смазочные масла изготавливаются на основе минерального или синтетического базового масла и присадок. Эти передовые присадки устраняют недостатки минеральных и синтетических базовых масел. В зависимости от проблемы, от которой они защищают масло и смазываемую машину, присадки можно разделить на несколько типов.

Присадки противоизносные

Эти добавки образуют на поверхности защитную жидкую пленку, которая защищает поверхность от преждевременного износа и окисления.Более того, их добавляют в масла, предназначенные для применения при экстремальных температурах.

Противозадирные присадки

Эти добавки образуют очень толстую и прочную защитную пленку. Смазочные масла и промышленные смазки, содержащие противозадирные присадки, используются, например, для смазки зубчатых передач. Однако их состав вызывает коррозию некоторых материалов.

Модификаторы трения

Они используются для моторных масел, в частности, для уменьшения трения и снижения энергопотребления.

Улучшители индекса вязкости

Применение этих присадок увеличивает стабильность масла в широком диапазоне температур.

Депрессанты

Их функция — снизить температуру застывания масла и улучшить его текучесть при низких температурах.

Ингибиторы окисления

Эти защитные агенты добавляются к маслам для сохранения их смазывающих свойств, поскольку они подвергаются экстремальным условиям эксплуатации (высокая температура и давление) и воздуху.

Ингибиторы ржавления и коррозии

Эти добавки требуются там, где вода и влага могут иметь разрушительное действие, особенно в компонентах, изготовленных из черных и цветных металлов.

Моющие и диспергаторы

Эти средства очищают поверхности от целевых соединений, уменьшая присутствие кислоты и защищая их от ржавчины и коррозии. Это достигается за счет диспергирования в масле любых загрязняющих веществ, что предотвращает образование шлама и отложений на металлических поверхностях даже после периода простоя.

Ингибиторы пенообразования

Противовспенивающие агенты необходимы, потому что, когда различные добавки взаимодействуют друг с другом, они могут образовывать пену. Пена может серьезно ухудшить эксплуатационные характеристики промышленного масла, поскольку пузырьки воздуха не позволяют маслу должным образом смазывать поверхность. Интересно, что недостаточное количество ингибиторов пенообразования может иметь обратный эффект, означающий, что может образоваться больше пены, что еще больше повлияет на масло.

Важно отметить, что все эти присадки и их функции со временем ослабевают , что также означает, что само масло теряет свое качество .Как только это произойдет или истечет срок службы масла, пора заменить индустриальное масло.

Классификация масла по заявке

Когда мы рассматриваем все области применения индустриальных масел, лучше всего представить их, обратившись к линейке индустриальных масел Valvoline. Каждый продукт из этой категории промышленных решений изготовлен из базовых масел премиум-класса и передовых присадок, чтобы удовлетворить эксплуатационные требования в тяжелых промышленных условиях. Обладая более чем 150-летним опытом инноваций, практическим опытом и партнерскими отношениями с ведущими производителями промышленного оборудования, мы смогли разработать лучшие индустриальные масла, смазки и другие продукты, обеспечивающие максимальную производительность и уход за машиной.

В зависимости от типа индустриальное масло Valvoline может использоваться для систем теплопередачи, высоконагруженных подшипников, турбин, компрессоров и водяных насосов, и это лишь некоторые из них.

Циркуляционное масло

Первый тип индустриального масла подходит для применения в подшипниках, цилиндрах, конических зубчатых передачах и червячных передачах в широком спектре промышленных применений. Они обладают высоким индексом вязкости и термостойкостью, а также защищают компоненты от износа, окисления, ржавчины и пены.Доступны в виде синтетических циркуляционных масел и минеральных циркуляционных масел, а также многих классов ISO.

Компрессорное масло

Масла этой категории используются в вакуумных насосах, воздушных компрессорах, винтовых, поршневых и пластинчато-роторных компрессорах. Они обладают превосходными противоизносными и деэмульгирующими свойствами и защищают поверхности от окисления и ржавчины. Доступны в виде синтетических компрессорных масел и минеральных компрессорных масел, а также различных классов ISO.

Масло теплоносителя

Их функция заключается в обеспечении постоянной и не требующей особого обслуживания теплопередачи в течение продолжительных периодов времени.По этим причинам они оснащены присадками для коррозии и окисления . Доступны в виде синтетических масел-теплоносителей и минеральных масел-теплоносителей.

Индустриальное трансмиссионное масло

Эти масла предназначены для выдерживания экстремальных давлений в промышленных редукторах, редукторах, бетоносмесительных машинах, циркуляционных системах, а также в сельскохозяйственном и судовом палубном оборудовании. Кроме того, они изолируют детали от износа, коррозии и окисления. Доступны в виде минеральных трансмиссионных масел с противозадирными присадками и синтетических трансмиссионных масел с противозадирными присадками.

Технологические масла

Valvoline Process Oils используются в качестве пластификаторов полимеров при производстве шин, резинотехнических изделий и изделий на полимерной основе. Кроме того, они соответствуют различным требованиям к продукту и эксплуатации.

Масла для направляющих скольжения

Valvoline Slideway Oils — это высокоэффективные смазочные материалы для направляющих скольжения промышленного применения, включая токарные, отрезные, фрезерные и шлифовальные станки. Их система присадок придает им адгезионные и фрикционные свойства, которые предотвращают прерывистое скольжение и обеспечивают плавное движение машины.

Турбинные масла

Состав турбинных масел Valvoline позволяет им удовлетворять строгие требования к подшипникам водяных, газовых и паровых турбин. Кроме того, они обеспечивают исключительную смазку, охлаждение и защиту благодаря ингибиторам окисления, ржавчины и коррозии и специальным противоизносным присадкам. Кроме того, эти турбинные масла могут использоваться в качестве гидравлических жидкостей и доступны с различными классами вязкости по ISO.

Преимущества индустриальных масел

Смазка необходима в любой отрасли промышленности , поскольку она снижает трение и износ в машинах .Детали машин и подшипники нуждаются в соответствующей смазке, чтобы их можно было защитить в течение всех рабочих циклов и различных рабочих условий.

Если посмотреть на ключевые преимущества правильной смазки высококачественными промышленными жидкими смазочными материалами, то они таковы:

  1. Защита от окисления, ржавчины, коррозии, образования отложений и других видов загрязнения и деградации увеличивает время безотказной работы оборудования и Оптимизированные интервалы обслуживания ,
  2. Способность выдерживать экстремальные условия работы и окружающей среды приводит к повышению эксплуатационной надежности и повышенной эксплуатационной эффективности ,
  3. Оптимизированная конфигурация оборудования приводит к сокращению использования смазочных материалов и пластичных смазок на и расход запасных частей ,
  4. Когда тяжелые машины и оборудование оптимально смазаны и защищены, затраты на техническое обслуживание снижаются на , а общая стоимость владения (TCO) на меньше .

Итого

Индустриальные масла обеспечивают смазку для промышленных машин и оборудования и, таким образом, поддерживают работу в тяжелых условиях . Кроме того, они обладают долговременной стабильностью, эффективностью и увеличенным сроком службы, что также соответствует требованиям , предъявляемым к промышленным установкам . Индустриальные масла разработаны, чтобы выдерживать тяжелые условия эксплуатации, включая высокие температуры и давление, а также большие нагрузки. Благодаря системе усовершенствованных присадок, добавленных к минеральному или синтетическому базовому маслу, они защищают машины и детали машин от износа, окисления, ржавчины, коррозии, образования отложений, шлама, а также повреждения или деградации поверхности.

Если вы заинтересованы в достижении максимальной производительности своих промышленных и производственных операций и хотите больше узнать о линейке индустриальных масел Valvoline, мы рекомендуем связаться с нашими экспертами.

Подробности — API меняет классификацию масла.

Название

API меняет классификацию масла.

Варианты названия

Альтернатива: Американский институт нефти меняет классификацию масел

Похожие заголовки

серии: Техническое примечание BLM; 42.

серии: Техническая записка (США. Бюро землепользования); 42.

по

Американский нефтяной институт.
Компания Чилтон.
Соединенные Штаты. Бюро землеустройства. Сервисный центр Портленда.

Тип

Книга

Материал

Опубликованный материал

Информация о публикации

Портленд, штат Орегон.:НАС. Департамент внутренних дел, Бюро землепользования, Сервисный центр Портленда, 1970 год.

Банкноты

Сообщает автомобильным операторам, что API изменило систему классификации моторных масел. Новая система предназначена для улучшения взаимодействия между потребителями моторного масла, поставщиками и производителями. Включена разбивка новых и старых классификаций.

Заголовок заголовка.

«Регистрационный код: 1525 (П-401)».

«Дата выпуска: октябрь 1970 г.»

«ТН-42» — Предполагается.

«Перепечатано Бюро землеустройства, Сервисный центр Портленда, из журнала« Коммерческие автомобили », сентябрь 1970 г., авторское право 1970 г., Компания Чилтон» — стр. 2.

Субъектов

Автомобили , Бюро землеустройства , Классификация , Смазочные масла , Обслуживание и ремонт , Записи и переписка , Грузовики , Соединенные Штаты , Профориентация

Телефонный номер

QL84.2 .L35 № 42

Язык

английский

Идентификаторы

OCLC: 1035014965

DOI

https://doi.org/10.5962/bhl.title.151743

Найти в местной библиотеке Скачать МОДЫ

Классификация разливов нефти по толщине с использованием нескольких удаленных датчиков

https: // doi.org / 10.1016 / j.rse.2019.111421Получить права и контент

Основные характеристики

Радарный спутник с синтезированной апертурой способен обнаруживать эмульсии разливов нефти

Классификация толщины нефти доставляется на судно, находящееся поблизости -в реальном времени

Полностью поляриметрический (Quadpol) сгенерировал классификацию толщины нефти / эмульсии

Измерения физической толщины нефти используются для проверки классификации

Аннотация

Синтетическая апертура спутника (SAR) — это оперативный инструмент для мониторинга и оценки разливов нефти.Спутниковый SAR в основном использовался для обнаружения наличия / отсутствия нефти, однако его способность различать нефтяные эмульсии в обнаруженном нефтяном пятне не была полностью использована. Кроме того, в прошлом одной из проблем была способность своевременно доставлять стратегическую информацию, полученную в результате спутникового дистанционного зондирования, местным оперативным службам. В этом исследовании представлены методы быстрой классификации типов нефти и предполагаемой толщины, из которых можно получить информацию о густой нефти и масляных эмульсиях (т.е., «полезная» нефть) может быть доставлена ​​в оперативные сроки к местным службам, осуществляющим реагирование. Эксперименты, проведенные на испытательном стенде OHMSETT в Нью-Джерси, демонстрируют, что при определенных условиях просмотра спутниковое РСА-изображение с одной поляризацией может регистрировать расхождение сигнала между густыми стабильными эмульсиями и неэмульгированным маслом. В ходе серии полевых кампаний в Мексиканском заливе с измерениями толщины нефти на месте были получены многочисленные спутниковые данные, включая полностью поляриметрические изображения SAR в диапазоне C от RADARSAT-2 и многоспектральные изображения с ASTER и WorldView-2.Одна кампания включала в себя бортовой поляриметрический датчик L-диапазона UAVSAR. Продукт классификации толщины нефти / эмульсии был создан на основе поляриметрических изображений RADARSAT-2 с использованием вычислений энтропии и коэффициента затухания. Здесь мы представляем методы классификации для получения продуктов толщины нефти из SAR, подтвержденные морскими наблюдениями, мультиспектральными изображениями и данными UAVSAR. Мы протестировали возможность доставки этих продуктов с минимальной задержкой на отвечающие суда через NOAA. Во время полевых операций в Мексиканском заливе продукт определения границ нефти по относительной толщине, полученный с помощью спутникового SAR, был доставлен на отвечающее судно через 42 минуты после сбора данных RADARSAT-2.Это испытание для подтверждения концепции с использованием спутникового SAR и мультиспектральных изображений для обнаружения эмульсий и доставки полученной информации на судно в точках, близких к реальному времени, непосредственно для методов спутниковых активов, которые будут использоваться в ближайшем будущем для ликвидации разливов нефти. операции тактического реагирования.

Ключевые слова

Разливы нефти

Толщина нефти

Нефтяные эмульсии

Изображения дистанционного зондирования

SAR

Рекомендуемые статьи Цитирующие статьи (0)

Полный текст

© 2019 Elsevier Inc.Все права защищены.

Рекомендуемые статьи

Цитирующие статьи

Классификация оливкового масла первого сорта с использованием потенциометрического электронного языка

DOI: 10.1016 / j.foodchem.2014.03.072. Epub 2014 29 марта.

Принадлежности Расширять

Принадлежности

  • 1 CIMO — Центр горных исследований, Escola Superior Agrária, Instituto Politécnico de Bragança, Campus Santa Apolónia, Apartado 1172, 5301-855 Bragança, Portugal.
  • 2 Instituto Politécnico de Coimbra, ISEC, DEQB, Rua Pedro Nunes, Quinta da Nora, 3030–1999, Коимбра, Португалия; CEB — Центр биологической инженерии, Университет Минью, Campus de Gualtar, 4710-057 Брага, Португалия.
  • 3 LAQUIPAI — Laboratório de Química Inorgânica Pura e de Aplicação Interdisciplinar, Departamento de Química, Faculdade de Ciências da, Universidade do Porto, Rua Campo Alegre no.687, 4169-007 Порту, Португалия.
  • 4 КПМН — Центр горных исследований, Эскола Сьюпериор Агрария, Политехнический институт Браганса, Кампус Санта-Аполония, Апартадо 1172, 5301-855 Браганса, Португалия; LSRE — Лаборатория разделения и разработки реакций — Ассоциированная лаборатория LSRE / LCM, Escola Superior Agrária, Instituto Politécnico de Bragança, Campus Santa Apolónia, Apartado 1172, 5301-855 Bragança, Portugal. Электронный адрес: [email protected].

Элемент в буфере обмена

Луис Джи Диас и др.Food Chem. .

Показать детали Показать варианты

Показать варианты

Формат АннотацияPubMedPMID

DOI: 10.1016 / j.foodchem.2014.03.072. Epub 2014 29 марта.

Принадлежности

  • 1 CIMO — Центр горных исследований, Escola Superior Agrária, Instituto Politécnico de Bragança, Campus Santa Apolónia, Apartado 1172, 5301-855 Bragança, Portugal.
  • 2 Instituto Politécnico de Coimbra, ISEC, DEQB, Rua Pedro Nunes, Quinta da Nora, 3030–1999, Коимбра, Португалия; CEB — Центр биологической инженерии, Университет Минью, Campus de Gualtar, 4710-057 Брага, Португалия.
  • 3 LAQUIPAI — Laboratório de Química Inorgânica Pura e de Aplicação Interdisciplinar, Departamento de Química, Faculdade de Ciências da, Universidade do Porto, Rua Campo Alegre no.687, 4169-007 Порту, Португалия.
  • 4 КПМН — Центр горных исследований, Эскола Сьюпериор Агрария, Политехнический институт Браганса, Кампус Санта-Аполония, Апартадо 1172, 5301-855 Браганса, Португалия; LSRE — Лаборатория разделения и разработки реакций — Ассоциированная лаборатория LSRE / LCM, Escola Superior Agrária, Instituto Politécnico de Bragança, Campus Santa Apolónia, Apartado 1172, 5301-855 Bragança, Portugal. Электронный адрес: [email protected].

Элемент в буфере обмена

Полнотекстовые ссылки Опции CiteDisplay

Показать варианты

Формат АннотацияPubMedPMID

Абстрактный

Идентификация этикеток оливковых масел экстра первого холодного отжима очень важна.Новый подход, основанный на потенциометрическом электронном языке, предлагается для классификации масел, полученных из отдельных сортов оливок (португальские сорта Cobrançosa, Madural, Verdeal Transmontana; испанские сорта Arbequina, Hojiblanca, Picual). Для выбора наиболее информативных наборов датчиков для создания прогнозных линейных дискриминантных моделей применялся метаэвристический алгоритм моделирования отжига. Оливковые масла были правильно классифицированы по сортам оливок (чувствительность более 97%), и каждое испанское оливковое масло было удовлетворительно отделено от португальского, за исключением сорта cv.Арбекина (чувствительность от 61% до 98%). Кроме того, дискриминантная способность была связана с содержанием полярных соединений в оливковом масле и, таким образом, косвенно, с органолептическими свойствами, такими как горечь, терпкость или острота. Поэтому предлагаемый электронный язык можно рассматривать как полезный вспомогательный инструмент для обученных сенсорных панелей для классификации моновариетальных оливковых масел экстра первого холодного отжима.

Ключевые слова: Оливковое масло первого отжима; Линейный дискриминантный анализ; Потенциометрический электронный язык; Алгоритм имитации отжига; Оливковый сорт.

Copyright © 2014 Elsevier Ltd. Все права защищены.

Похожие статьи

  • Оценка сенсорной интенсивности оливковых масел с помощью электронного языка.

    Veloso AC, Dias LG, Rodrigues N, Pereira JA, Peres AM. Велозо А.С. и др. Таланта. 2016, 1 января; 146: 585-93. DOI: 10.1016 / j.talanta.2015.08.071. Epub 2015 1 сентября.Таланта. 2016 г. PMID: 26695307

  • Влияние срока хранения оливок на качество масла трех португальских сортов Olea europea, Cobrançosa, Madural и Verdeal Transmontana.

    Перейра Дж. А., Касал С., Бенто А., Оливейра МБ. Pereira JA, et al. J. Agric Food Chem. 2002, 23 октября; 50 (22): 6335-40. DOI: 10.1021 / jf011661y. J. Agric Food Chem. 2002 г. PMID: 12381113

  • Характеристика оливковых масел первого холодного отжима из автохтонных галисийских сортов и их совместного измельчения с сортами Arbequina и Picual.

    Реборедо-Родригес П., Гонсалес-Баррейро С., Канчо-Гранде Б., Фрегапане Г., Сальвадор, доктор медицины, Сималь-Гандара Х. Реборедо-Родригес П. и др. Food Chem. 2015, 1 июня; 176: 493-503. DOI: 10.1016 / j.foodchem.2014.12.078. Epub 2014 25 декабря. Food Chem. 2015 г. PMID: 25624261

  • Биоактивные свойства основных тритерпенов, содержащихся в оливках, оливковом масле первого отжима и листьях Olea europaea.

    Санчес-Кесада С., Лопес-Биедма А., Варлета Ф., Кампос М., Бельтран Г., Гафорио Дж. Дж. Санчес-Кесада С. и др. J. Agric Food Chem. 2013, 18 декабря; 61 (50): 12173-82. DOI: 10.1021 / jf403154e. Epub 2013 22 ноября. J. Agric Food Chem. 2013. PMID: 24279741 Рассмотрение.

  • Соединения, отвечающие за сенсорный профиль в оливковых маслах первого сорта.

    Кампестре С., Анджелини Дж., Гасбарри С., Ангероза Ф.Campestre C, et al. Молекулы. 2017 27 октября; 22 (11): 1833. DOI: 10,3390 / молекулы22111833. Молекулы. 2017 г. PMID: 2

  • 48 Бесплатная статья PMC. Рассмотрение.

Процитировано

6 статьи
  • Стратегии улучшения цепочки поставок пищевых продуктов с помощью новых технологий обработки пищевых продуктов во время пандемии COVID-19.

    Читракар Б., Чжан М., Бхандари Б. Читракар Б. и др. Контроль пищевых продуктов. Июль 2021; 125: 108010. DOI: 10.1016 / j.foodcont.2021.108010. Epub 2021 27 февраля. Контроль пищевых продуктов. 2021 г. PMID: 33679006 Бесплатная статья PMC. Рассмотрение.

  • Историческая эволюция и достижения в области контроля пищевых продуктов в области ближней инфракрасной спектроскопии, электронного носа и электронного языка.

    Aouadi B, Zaukuu JZ, Vitális F, Bodor Z, Fehér O, Gillay Z, Bazar G, Kovacs Z. Aouadi B, et al. Датчики (Базель). 2020 24 сентября; 20 (19): 5479. DOI: 10,3390 / s20195479. Датчики (Базель). 2020. PMID: 32987908 Бесплатная статья PMC. Рассмотрение.

  • Оптоэлектронный язык на основе кремния для неспецифического распознавания растительных масел без этикеток.

    Олийнык Б.В., Исаева К., Манилов А.И., Нычипорук Т., Гелоен А., Жоффр Ф., Скрышевский В.А., Литвиненко С.В., Лысенко В.Олийнык Б.В. и др. САУ Омега. 12 марта 2020 г .; 5 (11): 5638-5642. DOI: 10.1021 / acsomega.9b03196. eCollection 2020 24 марта. САУ Омега. 2020. PMID: 32226839 Бесплатная статья PMC.

  • Вольтамперометрический электронный язык для одновременного определения трех бензодиазепинов.

    Эррера-Чакон А., Тораби Ф., Фаридбод Ф., Гасеми Дж. Б., Гонсалес-Калабуиг А., Дель Валле М.Эррера-Чакон А. и др. Датчики (Базель). 2019 16 ноября; 19 (22): 5002. DOI: 10,3390 / s102. Датчики (Базель). 2019. PMID: 31744128 Бесплатная статья PMC.

  • Органолептический анализ питьевой воды с помощью электронного языка на основе электрохимических микросенсоров.

    Гутьеррес-Капитан М., Брюль-Фонцере М., Хименес-Хоркера К. Gutiérrez-Capitán M, et al.Датчики (Базель). 2019 23 марта; 19 (6): 1435. DOI: 10,3390 / s135. Датчики (Базель). 2019. PMID: 30

    3 Бесплатная статья PMC.

Типы публикаций

  • Поддержка исследований, за пределами США. Правительство

Условия MeSH

  • Электрооборудование и материалы *
  • Растительные масла / классификация

LinkOut — дополнительные ресурсы

  • Источники полных текстов

  • Другие источники литературы

[Икс]

цитировать

Копировать

Формат: AMA APA ГНД NLM

Как разработать модель несбалансированной классификации для обнаружения разливов нефти

Последнее обновление 5 января 2021 г.

Многие задачи несбалансированной классификации требуют умелой модели, которая предсказывает четкую метку класса, где оба класса одинаково важны.

Примером проблемы несбалансированной классификации, когда требуется метка класса и оба класса одинаково важны, является обнаружение нефтяных разливов или пятен на спутниковых изображениях. Обнаружение разлива требует мобилизации дорогостоящих мер реагирования, а пропустить событие столь же дорого, что наносит ущерб окружающей среде.

Один из способов оценки несбалансированных моделей классификации, которые предсказывают четкие метки, — это вычисление отдельной точности для положительного и отрицательного классов, называемой чувствительностью и специфичностью.Затем эти две меры могут быть усреднены с использованием среднего геометрического, называемого G-средним, которое нечувствительно к асимметричному распределению классов и правильно сообщает о навыках модели в обоих классах.

В этом руководстве вы узнаете, как разработать модель для прогнозирования наличия разлива нефти на спутниковых изображениях и оценить его с помощью показателя G-среднего.

После прохождения этого руководства вы будете знать:

  • Как загрузить и изучить набор данных и выработать идеи для подготовки данных и выбора модели.
  • Как оценить набор вероятностных моделей и повысить их производительность с помощью соответствующей подготовки данных.
  • Как подогнать окончательную модель и использовать ее для прогнозирования меток классов для конкретных случаев.

Начните свой проект с моей новой книги «Несбалансированная классификация с Python», включая пошаговые руководства и файлы исходного кода Python для всех примеров.

Приступим.

  • Обновлено в январе / 2021 г. : обновлены ссылки на документацию по API.

Разработка модели несбалансированной классификации для обнаружения разливов нефти
Фото Lenny K Photography, некоторые права защищены.

Обзор учебного пособия

Это руководство разделено на пять частей; их:

  1. Набор данных о разливе нефти
  2. Изучение набора данных
  3. Тест модели и исходный результат
  4. Оценить модели
    1. Оценка вероятностных моделей
    2. Оценить сбалансированную логистическую регрессию
    3. Оценка передискретизации с помощью вероятностных моделей
  5. Сделайте прогноз на основе новых данных

Набор данных о разливе нефти

В этом проекте мы будем использовать стандартный несбалансированный набор данных машинного обучения, называемый набором данных « разлив нефти », набор данных « нефтяных пятен » или просто « нефть .”

Набор данных был представлен в статье 1998 г. Мирославом Кубатом и др. под названием «Машинное обучение для обнаружения разливов нефти на спутниковых радиолокационных изображениях». Набор данных часто приписывают Роберту Холту, соавтору статьи.

Набор данных был разработан на основе спутниковых изображений океана, некоторые из которых содержат разливы нефти, а некоторые нет. Изображения были разделены на разделы и обработаны с использованием алгоритмов компьютерного зрения, чтобы предоставить вектор функций для описания содержимого раздела или фрагмента изображения.

Входными данными [система] является необработанное пиксельное изображение с радиолокационного спутника. Используются методы обработки изображений […] Выходные данные обработки изображения представляют собой вектор признаков фиксированной длины для каждой подозрительной области. Во время нормальной работы эти векторы признаков загружаются в классификатор, чтобы решить, какие изображения и какие области в изображении представить для проверки человеком.

— Машинное обучение для обнаружения разливов нефти на спутниковых радиолокационных изображениях, 1998.

Задаче задается вектор, который описывает содержимое фрагмента спутникового изображения, а затем предсказывает, содержит ли фрагмент разлив нефти или нет, например.грамм. от незаконного или случайного сброса нефти в океан.

Есть 937 случаев. Каждый случай состоит из 48 функций, производных от компьютерного зрения, номера патча и метки класса.

Всего девять спутниковых изображений были обработаны в участки. Наблюдения в наборе данных упорядочены по изображениям, а первый столбец набора данных представляет номер патча для изображения. Это было предоставлено для оценки производительности модели для каждого изображения. В этом случае нас не интересует изображение или номер патча, и этот первый столбец можно удалить.

Нормальным случаем является отсутствие разлива нефти, которому присвоена метка класса 0, тогда как разлив нефти обозначается меткой класса 1. Имеется 896 случаев отсутствия разлива нефти и 41 случай разлива нефти.

Вторую критическую особенность области разлива нефти можно назвать несбалансированной обучающей выборкой: отрицательных примеров-двойников гораздо больше, чем положительных примеров нефтяных разливов. Из 41 положительного примера у нас есть 896 отрицательных примеров, поэтому класс большинства составляет почти 96% данных.

— Машинное обучение для обнаружения разливов нефти на спутниковых радиолокационных изображениях, 1998.

У нас нет доступа к программе, используемой для подготовки функций компьютерного зрения из спутниковых изображений, поэтому мы ограничены работой с извлеченными функциями, которые были собраны и предоставлены.

Теперь давайте подробнее рассмотрим данные.

Хотите начать работу с классификацией дисбаланса?

Пройдите мой бесплатный 7-дневный ускоренный курс электронной почты (с образцом кода).

Нажмите, чтобы зарегистрироваться, а также получите бесплатную электронную версию курса в формате PDF.

Загрузите БЕСПЛАТНЫЙ мини-курс

Изучите набор данных

Сначала загрузите набор данных и сохраните его в текущем рабочем каталоге с именем « oil-spill.csv »

Просмотрите содержимое файла.

Первые несколько строк файла должны выглядеть следующим образом:

1,2558,1506,09,456,63,90,6395000,40.88,7.89,29780,0.19,214.7,0.21,0.26,0.49,0.1,0.4,99.59,32.19,1.84,0.16,0.2,87.65,0,0.47,132.78, -0.01,3.78,0.22,3.2, -3.71, -0.18,2.19,0,2.19,310,16110,0,138.68,89,69,2850,1000,763.16,135.46,3.73,0,33243.19,65.74,7.95,1 2,22325,79.11,841.03,180,55812500,51.11,1.21,61900,0.02,901.7,0.02,0.03,0.11,0.01,0.11,6058.23,4061.15,2.3,0.02,0.02,87.65,0,0.58,132.78, -0.01,3.78,0.84,7.09, -2.21,0,0,0,0,704,40140,0,68.65,89,69,5750,11500,9593.48,1648.8,0.6,0,51572.04,65.73,6.26,0 3,115,1449,85,608,43,88,287500,40.42,7.34,3340,0.18,86.1,0.21,0.32,0.5,0.17,0.34,71.2,16.73,1.82,0.19,0.29,87.65,0,0.46,132.78, -0.01,3.78,0.7,4.79, -3.36, -0.23,1.95,0,1.95,29,1530,0.01,38.8,89,69,1400,250,150,45,13,9.33,1,31692.84,65.81,7.84,1 4,1201,1562.53,295.65,66,3002500,42.4,7.97,18030,0.19,166.5,0.21,0.26,0.48,0.1,0.38,120.22,33.47,1.91,0.16,0.21,87.65,0,0.48,132.78, -0,01,3,78,0,84,6,78, -3,54, -0,33,2,2,0,2,2,183,10080,0,108,27,89,69,6041,52,761,58,453,21,144,97,13,33,1,37696,21,65,67,8,07,1 5,312,950,27,440,86,37,780000,41.43,7.03,3350,0.17,232.8,0.15,0.19,0.35,0.09,0.26,289.19,48.68,1.86,0.13,0.16,87.65,0,0.47,132.78, -0.01,3.78,0.02,2.28, -3.44, -0.44,2.19,0,2.19,45,2340,0,14.39,89,69,1320.04,710.63,512.54,109.16,2.58,0,29038.17,65.66,7.35,0 …

1,2558,1506.09,456.63,90,6395000,40.88,7.89,29780,0.19,214.7,0.21,0.26,0.49,0.1,0.4,99.59,32.19,1.84,0.16,0.2,87.65,0,0.47, 132,78, -0,01,3,78,0,22,3,2, -3,71, -0,18,2,19,0,2,19,310,16110,0,138,68,89,69,2850,1000,763.16,135.46,3.73,0,33243.19,65.74,7.95,1

2,22325,79.11,841.03,180,55812500,51.11,1.21,61900,0.02,901.7,0.02,0.03,0.11,0.01,0.11,6058.23,4061.15 , 2.3,0.02,0.02,87.65,0,0.58,132.78, -0.01,3.78,0.84,7.09, -2.21,0,0,0,0,704,40140,0,68.65,89,69,5750,11500,9593,48 , 1648.8,0.6,0,51572.04,65.73,6.26,0

3,115,1449.85,608.43,88,287500,40.42,7.34,3340,0.18,86.1,0.21,0.32,0.5,0.17,0.34,71.2,16.73, 1.82,0.19,0.29,87.65,0,0.46,132.78, -0.01,3.78,0.7,4.79, -3.36, -0.23,1.95,0,1.95,29,1530,0.01,38.8,89,69,1400,250,150,45,13,9,33,1,31692,84,65,81,7,84,1

4,1201,1562,53,295,65,66,3002500,42,4,7,97,18030,0,19,166,5,0,21,0,26 , 0,48,0,1,0,38,120,22,33,47,1,91,0,16,0,21,87,65,0,0,48,132,78, -0,01,3,78,0,84,6,78, -3,54, -0,33,2,2,0,2,2,183,10080, 0,108,27,89,69,6041,52,761,58,453,21,144,97,13,33,1,37696,21,65,67,8,07,1

5,312,950,27,440,86,37,780000,41,43,7,03,3350,0,17,232,8,0,15,0,19,0,35 , 0,09,0,26,289,19,48,68,1,86,0,13,0,16,87,65,0,0,47,132,78, -0,01,3,78,0,02,2,28, -3,44, -0.44,2.19,0,2.19,45,2340,0,14.39,89,69,1320.04,710.63,512.54,109.16,2.58,0,29038.17,65.66,7.35,0

Мы видим, что первый столбец содержит целые числа для номера патча. Мы также можем видеть, что производные функции компьютерного зрения имеют действительные значения с разными масштабами, такими как тысячи во втором столбце и дроби в других столбцах.

Все входные переменные являются числовыми, и отсутствуют пропущенные значения, отмеченные «?». ”персонаж.

Во-первых, мы можем загрузить набор данных CSV и подтвердить количество строк и столбцов.

Набор данных можно загрузить как DataFrame с помощью функции Pandas read_csv (), указав местоположение и факт отсутствия строки заголовка.

… # определить местоположение набора данных filename = ‘oil-spill.csv’ # загружаем csv файл как фрейм данных dataframe = read_csv (имя файла, заголовок = Нет)

# определить местоположение набора данных

filename = ‘oil-spill.csv’

# загрузить файл csv как фрейм данных

dataframe = read_csv (filename, header = None)

После загрузки мы можем суммировать количество строк и столбцов, распечатав форму DataFrame.

… # суммируем форму набора данных печать (dataframe.shape)

# суммировать форму набора данных

print (dataframe.shape)

Мы также можем суммировать количество примеров в каждом классе, используя объект Counter.

… # подвести итоги распределения классов target = dataframe.values ​​[:, — 1] counter = Counter (цель) для k, v в counter.items (): per = v / len (цель) * 100 print (‘Класс =% d, Счетчик =% d, Процент =%. 3f %%’% (k, v, per))

# суммировать распределение классов

target = dataframe.values ​​[:, — 1]

counter = Counter (target)

для k, v в counter.items ():

per = v / len (цель) * 100

print (‘Class =% d, Count =% d, Percentage =%. 3f %%’% (k, v, per))

Полный пример загрузки и обобщения набора данных приведен ниже.

# загружаем и резюмируем набор данных из панд импортировать read_csv из коллекций счетчик импорта # определить местоположение набора данных filename = ‘разлив нефти.csv ‘ # загружаем csv файл как фрейм данных dataframe = read_csv (имя файла, заголовок = Нет) # суммируем форму набора данных печать (dataframe.shape) # подвести итоги распределения классов target = dataframe.values ​​[:, — 1] counter = Counter (цель) для k, v в counter.items (): per = v / len (цель) * 100 print (‘Класс =% d, Счетчик =% d, Процент =%. 3f %%’% (k, v, per))

# загрузить и суммировать набор данных

из pandas import read_csv

из коллекции import Counter

# определить местоположение набора данных

filename = ‘oil-spill.csv ‘

# загрузить файл csv как фрейм данных

dataframe = read_csv (filename, header = None)

# суммировать форму набора данных

print (dataframe.shape)

# суммировать распределение классов

target = dataframe.values ​​[:, — 1]

counter = Counter (target)

для k, v в counter.items ():

per = v / len (target) * 100

print (‘ Класс =% d, Счетчик =% d, Процент =%. 3f %% ‘% (k, v, per))

При выполнении примера сначала загружается набор данных и подтверждается количество строк и столбцов.

Затем суммируется распределение по классам, подтверждающее количество разливов и неразливов нефти и процент случаев в классах меньшинства и большинства.

(937, 50) Класс = 1, Количество = 41, Процент = 4,376% Класс = 0, Количество = 896, Процент = 95,624%

(937, 50)

Класс = 1, Количество = 41, Процент = 4,376%

Класс = 0, Количество = 896, Процент = 95,624%

Мы также можем взглянуть на распределение каждой переменной, создав для каждой гистограмму.

С 50 переменными, это очень много графиков, но мы можем обнаружить некоторые интересные закономерности. Кроме того, при таком большом количестве графиков мы должны отключить метки осей и заголовки графиков, чтобы уменьшить беспорядок. Полный пример приведен ниже.

# создаем гистограммы каждой переменной из панд импортировать read_csv из matplotlib import pyplot # определить местоположение набора данных filename = ‘oil-spill.csv’ # загружаем csv файл как фрейм данных dataframe = read_csv (имя файла, заголовок = Нет) # создаем график гистограммы каждой переменной ax = фрейм данных.hist () # отключить метки осей для оси в ax.flatten (): axis.set_title (») axis.set_xticklabels ([]) axis.set_yticklabels ([]) pyplot.show ()

# создать гистограммы каждой переменной

из pandas import read_csv

from matplotlib import pyplot

# определить местоположение набора данных

filename = ‘oil-spill.csv’

# загрузить файл csv как фрейм данных

dataframe = read_csv (filename, header = None)

# создать график гистограммы для каждой переменной

ax = dataframe.hist ()

# отключить метки осей

для оси в ax.flatten ():

axis.set_title (»)

axis.set_xticklabels ([])

axis.set_yticklabels ([])

pyplot .show ()

При выполнении примера создается фигура с одним подпунктом гистограммы для каждой из 50 переменных в наборе данных.

Мы можем видеть много разных распределений, одни с гауссовскими, другие с кажущимися экспоненциальными или дискретными распределениями.

В зависимости от выбора алгоритмов моделирования мы ожидаем, что будет полезно масштабирование распределений до одного и того же диапазона и, возможно, использование некоторых степенных преобразований.

Гистограмма каждой переменной в наборе данных о разливе нефти

Теперь, когда мы рассмотрели набор данных, давайте рассмотрим разработку тестового набора для оценки моделей-кандидатов.

Тест модели и исходный результат

Мы будем оценивать модели-кандидаты с помощью многократной стратифицированной k-кратной перекрестной проверки.

Процедура перекрестной проверки в k-кратном размере обеспечивает хорошую общую оценку производительности модели, которая не слишком оптимистична, по крайней мере, по сравнению с одним разделением теста на поезд. Мы будем использовать k = 10, что означает, что каждая складка будет содержать около 937/10 или около 94 примеров.

Стратифицированный означает, что каждая складка будет содержать одну и ту же смесь примеров по классам, то есть от 96% до 4% без разливов и разливов. Повторение означает, что процесс оценки будет выполняться несколько раз, чтобы избежать случайных результатов и лучше уловить дисперсию выбранной модели.Мы будем использовать три повтора.

Это означает, что одна модель будет соответствовать и оценена 10 * 3 или 30 раз, и будут указаны среднее и стандартное отклонение этих прогонов.

Этого можно достичь с помощью класса scikit-learn RepeatedStratifiedKFold.

Мы прогнозируем метки классов того, содержит ли фрагмент спутникового изображения разлив или нет. Есть много показателей, которые мы могли бы использовать, хотя авторы статьи решили указать чувствительность, специфичность и среднее геометрическое двух оценок, называемое G-средним.

С этой целью мы в основном использовали среднее геометрическое (g-среднее) […] Эта мера имеет отличительное свойство не зависеть от распределения примеров между классами и, таким образом, является устойчивой в обстоятельствах, когда это распределение может измениться с время или отличаться в тренировочных и тестовых наборах.

— Машинное обучение для обнаружения разливов нефти на спутниковых радиолокационных изображениях, 1998.

Напомним, что чувствительность — это мера точности для положительного класса, а специфичность — это мера точности для отрицательного класса.

  • Чувствительность = TruePositives / (TruePositives + FalseNegatives)
  • Специфичность = TrueNegatives / (TrueNegatives + FalsePositives)

G-среднее ищет баланс этих оценок, среднее геометрическое, где плохая производительность для одного или другого приводит к низкому G-среднему баллу.

  • G-Среднее = sqrt (Чувствительность * Специфичность)

Мы можем вычислить G-среднее для набора прогнозов, сделанных моделью, используя функцию geometry_mean_score (), предоставляемую библиотекой imbalanced-learn.

Во-первых, мы можем определить функцию для загрузки набора данных и разделения столбцов на входные и выходные переменные. Мы также опустим столбец 22, потому что столбец содержит одно значение, и первый столбец, который определяет номер патча изображения. Это реализует функция load_dataset () ниже.

# загрузить набор данных def load_dataset (полный_путь): # загружаем набор данных как массив numpy data = read_csv (полный_путь, заголовок = Нет) # удалить неиспользуемые столбцы данные.drop (22, axis = 1, inplace = True) data.drop (0, ось = 1, inplace = True) # получить массив numpy data = data.values # разделить на элементы ввода и вывода X, y = данные [:,: -1], данные [:, -1] # метка кодирует целевую переменную, чтобы иметь классы 0 и 1 y = LabelEncoder (). fit_transform (y) возврат X, y

# загрузить набор данных

def load_dataset (full_path):

# загрузить набор данных как массив numpy

data = read_csv (full_path, header = None)

# удалить неиспользуемые столбцы

data.drop (22, axis = 1, inplace = True)

data.drop (0, axis = 1, inplace = True)

# получить массив numpy

data = data.values ​​

# разделить на элементы ввода и вывода

X, y = data [:,: -1], data [:, -1]

# label кодирует целевую переменную, чтобы иметь классы 0 и 1

y = LabelEncoder (). Fit_transform (y)

возврат X, y

Затем мы можем определить функцию, которая будет оценивать данную модель в наборе данных и возвращать список G-средних оценок для каждого сгиба и повторения.

Функция calculate_model () ниже реализует это, принимая набор данных и модель в качестве аргументов и возвращая список оценок.

# оценить модель def оценивать_модель (X, y, модель): # определить процедуру оценки cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1) # определить метрику оценки модели metric = make_scorer (геометрическое_среднее_счет) # оценить модель оценки = cross_val_score (модель, X, y, оценка = метрика, cv = cv, n_jobs = -1) возврат баллов

# оценить модель

def rating_model (X, y, model):

# определить процедуру оценки

cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1)

# определить метрику оценки модели

metric = make_scorer (geometry_mean_score)

# оцените модель

scores = cross_val_score (model, X, y, scoring = metric, cv = cv, n_jobs = -1)

возвратных баллов

Наконец, мы можем оценить базовую модель набора данных с помощью этого тестового набора.

Модель, которая прогнозирует метку класса большинства (0) или метку класса меньшинства (1) для всех случаев, приведет к G-среднему нулю. Таким образом, хорошей стратегией по умолчанию было бы случайное предсказание той или иной метки класса с вероятностью 50% и стремление к G-среднему примерно 0,5.

Этого можно достичь с помощью класса DummyClassifier из библиотеки scikit-learn и установки аргумента «стратегия , » равным « uniform ».

… # определить эталонную модель model = DummyClassifier (стратегия = ‘униформа’)

# определить эталонную модель

model = DummyClassifier (strategy = ‘uniform’)

После оценки модели мы можем напрямую сообщить о среднем значении и стандартном отклонении G-средних оценок.

… # оценить модель результат_м, результат_с = оценка_модель (X, y, модель) # подвести итоги print (‘Среднее G-Среднее:%.3f (% .3f) ‘% (result_m, result_s))

# оценить модель

result_m, result_s = valu_model (X, y, model)

# summarize performance

print (‘Mean G-Mean:% .3f (% .3f)’% (результат_м, результат_с))

Собирая все вместе, ниже приведен полный пример загрузки набора данных, оценки базовой модели и отчета о производительности.

# тестовая оснастка и оценка базовой модели из коллекций счетчик импорта из среднего значения импорта из numpy import std из панд импортировать read_csv из склеарна.предварительная обработка импорта LabelEncoder из sklearn.model_selection импорт cross_val_score из sklearn.model_selection import RepeatedStratifiedKFold из imblearn.metrics import geometry_mean_score из sklearn.metrics импортировать make_scorer из sklearn.dummy import DummyClassifier # загрузить набор данных def load_dataset (полный_путь): # загружаем набор данных как массив numpy data = read_csv (полный_путь, заголовок = Нет) # удалить неиспользуемые столбцы data.drop (22, ось = 1, inplace = True) данные.drop (0, ось = 1, inplace = True) # получить массив numpy data = data.values # разделить на элементы ввода и вывода X, y = данные [:,: -1], данные [:, -1] # метка кодирует целевую переменную, чтобы иметь классы 0 и 1 y = LabelEncoder (). fit_transform (y) вернуть X, y # оценить модель def оценивать_модель (X, y, модель): # определить процедуру оценки cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1) # определить метрику оценки модели metric = make_scorer (геометрическое_среднее_счет) # оценить модель оценки = cross_val_score (модель, X, y, оценка = метрика, cv = cv, n_jobs = -1) вернуть баллы # определить расположение набора данных full_path = ‘разлив нефти.csv ‘ # загрузить набор данных X, y = load_dataset (полный_путь) # суммируем загруженный набор данных печать (X.shape, y.shape, Counter (y)) # определить эталонную модель model = DummyClassifier (стратегия = ‘униформа’) # оценить модель оценки = оценка_модель (X, y, модель) # подвести итоги print (‘Среднее G-Среднее:% .3f (% .3f)’% (среднее (баллы), стандартное (баллы)))

1

2

3

4

5

6

7

8

9

10

11

12

13

140002

18

19

20

21

22

23

24

25

26

27

28

29

30

000

000 34

35

36

37

38

39

40

41

42

43

44

45

46

48

0003

# тестовый жгут и оценка базовой модели

из импорта коллекций Счетчик

из numpy import mean

из numpy import std

из pandas import read_csv

из sklearn.предварительная обработка import LabelEncoder

из sklearn.model_selection import cross_val_score

из sklearn.model_selection import RepeatedStratifiedKFold

из imblearn.metrics import geometry_mean_score

000 из sklearnmyscorex

0003 dataset

def load_dataset (full_path):

# загрузить набор данных в виде массива numpy

data = read_csv (full_path, header = None)

# удалить неиспользуемые столбцы

data.drop (22, axis = 1, inplace = True)

data.drop (0, axis = 1, inplace = True)

# получить массив numpy

data = data.values ​​

# разделить на элементы ввода и вывода

X, y = data [:,: -1], data [:, -1]

# label кодирует целевую переменную, чтобы иметь классы 0 и 1

y = LabelEncoder (). Fit_transform (y)

return X, y

# оценить модель

def rating_model (X, y, model):

# определить процедуру оценки

cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1)

# определить метрику оценки модели

metric = make_scorer (geometry_mean_score)

# оценить модель

scores = cross_val_score (model, X, y, scoring = metric, cv = cv, n_jobs = -1)

return scores

# определить местоположение набора данных

full_path = ‘разлив нефти.csv ‘

# загрузить набор данных

X, y = load_dataset (full_path)

# суммировать загруженный набор данных

print (X.shape, y.shape, Counter (y))

# определить эталонную модель

model = DummyClassifier (strategy = ‘uniform’)

# оценить модель

scores = valu_model (X, y, model)

# summarize performance

print (‘Среднее G-Среднее:% .3f (%. 3f) ‘% (среднее (баллы), стандартное (баллы)))

При запуске примера сначала загружается и резюмируется набор данных.

Мы видим, что у нас есть правильное количество загруженных строк и что у нас есть 47 входных переменных, производных от компьютерного зрения, с удаленными столбцом постоянного значения (индекс 22) и столбцом номера патча (индекс 0).

Важно отметить, что мы можем видеть, что метки классов имеют правильное сопоставление с целыми числами с 0 для класса большинства и 1 для класса меньшинства, обычного для несбалансированного набора данных двоичной классификации.

Затем выводится среднее значение G-средних.

В этом случае мы видим, что базовый алгоритм достигает G-Mean около 0,47, что близко к теоретическому максимуму 0,5. Эта оценка обеспечивает нижний предел навыков модели; любая модель, которая достигает среднего G-среднего выше примерно 0,47 (или действительно выше 0,5), обладает навыками, тогда как модели, которые достигают оценки ниже этого значения, не имеют навыков в этом наборе данных.

(937, 47) (937,) Счетчик ({0: 896, 1: 41}) Среднее G-среднее: 0,478 (0,143)

(937, 47) (937,) Счетчик ({0: 896, 1: 41})

Среднее G-среднее: 0.478 (0,143)

Интересно отметить, что хорошее G-среднее значение, указанное в документе, было около 0,811, хотя процедура оценки модели была иной. Это дает приблизительную цель для производительности « хорошо, » для этого набора данных.

Теперь, когда у нас есть тестовая оснастка и базовый уровень производительности, мы можем приступить к оценке некоторых моделей в этом наборе данных.

Оценить модели

В этом разделе мы оценим набор различных методов для набора данных с использованием тестовой оснастки, разработанной в предыдущем разделе.

Цель состоит в том, чтобы продемонстрировать, как систематически решать проблему, и продемонстрировать возможности некоторых методов, разработанных для несбалансированных задач классификации.

Заявленная производительность хорошая, но не оптимизирована (например, гиперпараметры не настраиваются).

Какой балл вы можете получить? Если вы можете достичь лучших показателей G-среднего с помощью того же тестового набора, я был бы рад услышать об этом. Позвольте мне знать в комментариях ниже.

Оценка вероятностных моделей

Начнем с оценки некоторых вероятностных моделей в наборе данных.

Вероятностные модели — это те модели, которые подходят для данных в рамках вероятностной структуры и часто хорошо работают в целом для несбалансированных наборов данных классификации.

Мы будем оценивать следующие вероятностные модели с гиперпараметрами по умолчанию в наборе данных:

  • Логистическая регрессия (LR)
  • Линейный дискриминантный анализ (LDA)
  • Наивный Байес по Гауссу (NB)

И LR, и LDA чувствительны к масштабу входных переменных и часто ожидают и / или работают лучше, если входные переменные с разными масштабами нормализованы или стандартизированы в качестве шага предварительной обработки.

В этом случае мы стандартизируем набор данных перед подгонкой каждой модели. Это будет достигнуто с помощью конвейера и класса StandardScaler. Использование конвейера гарантирует, что StandardScaler подходит для обучающего набора данных и применяется к обучающим и тестовым наборам в каждой k-кратной оценке перекрестной проверки, избегая любой утечки данных, которая может привести к оптимистичному результату.

Мы можем определить список моделей для оценки на нашем тестовом жгуте следующим образом:

… # определить модели модели, имена, результаты = список (), список (), список () # LR models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’))])) names.append (‘LR’) # LDA models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LinearDiscriminantAnalysis ())])) names.append (‘LDA’) # NB models.append (GaussianNB ()) names.append (‘NB’)

# определить модели

models, names, results = list (), list (), list ()

# LR

models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’))]))

names.append (‘LR’)

# LDA

models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LinearDiscriminantAnalysis ())]))

names.append (‘LDA’)

# NB

models.append (GaussianNB ())

names.append (‘NB’)

После определения мы можем перечислить список и оценить каждый по очереди. Среднее значение и стандартное отклонение G-средних баллов можно распечатать во время оценки, а выборку баллов можно сохранить.

Алгоритмы можно сравнивать напрямую на основе их среднего G-среднего значения.

… # оценить каждую модель для i в диапазоне (len (модели)): # оценить модель и сохранить результаты оценки = оценка_модель (X, y, модели [i]) results.append (баллы) # подвести итоги и сохранить print (‘>% s% .3f (% .3f)’% (имена [i], среднее (баллы), стандартное (баллы)))

# оценить каждую модель

for i in range (len (models)):

# оценить модель и сохранить результаты

scores = eval_model (X, y, models [i])

полученные результаты.append (scores)

# суммировать и сохранить

print (‘>% s% .3f (% .3f)’% (names [i], mean (score), std (score)))

В конце прогона мы можем использовать оценки, чтобы создать диаграмму прямоугольников и усов для каждого алгоритма.

Создание параллельных графиков позволяет сравнивать распределения как по среднему баллу, так и по средним 50 процентам распределения между 25-м и 75-м процентилями.

… # построить график результатов pyplot.boxplot (результаты, метки = имена, showmeans = True) pyplot.show ()

# построить график результатов

pyplot.boxplot (results, labels = names, showmeans = True)

pyplot.show ()

Если объединить все вместе, то ниже приведен полный пример сравнения трех вероятностных моделей из набора данных о разливе нефти с использованием тестовой оснастки.

# сравнить вероятностную модель с набором данных о разливе нефти из среднего значения импорта из numpy import std из панд импортировать read_csv из matplotlib import pyplot из склеарна.предварительная обработка импорта LabelEncoder из sklearn.model_selection импорт cross_val_score из sklearn.model_selection import RepeatedStratifiedKFold из sklearn.metrics импортировать make_scorer из sklearn.linear_model import LogisticRegression из sklearn.discriminant_analysis import LinearDiscriminantAnalysis из sklearn.naive_bayes импортировать GaussianNB из imblearn.metrics import geometry_mean_score из sklearn.pipeline import Pipeline из sklearn.preprocessing import StandardScaler # загрузить набор данных def load_dataset (полный_путь): # загружаем набор данных как массив numpy data = read_csv (полный_путь, заголовок = Нет) # удалить неиспользуемые столбцы данные.drop (22, axis = 1, inplace = True) data.drop (0, ось = 1, inplace = True) # получить массив numpy data = data.values # разделить на элементы ввода и вывода X, y = данные [:,: -1], данные [:, -1] # метка кодирует целевую переменную, чтобы иметь классы 0 и 1 y = LabelEncoder (). fit_transform (y) вернуть X, y # оценить модель def оценивать_модель (X, y, модель): # определить процедуру оценки cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1) # определить метрику оценки модели metric = make_scorer (геометрическое_среднее_счет) # оценить модель оценки = cross_val_score (модель, X, y, оценка = метрика, cv = cv, n_jobs = -1) вернуть баллы # определить расположение набора данных full_path = ‘разлив нефти.csv ‘ # загрузить набор данных X, y = load_dataset (полный_путь) # определить модели модели, имена, результаты = список (), список (), список () # LR models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’))])) names.append (‘LR’) # LDA models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LinearDiscriminantAnalysis ())])) names.append (‘LDA’) # NB models.append (GaussianNB ()) names.append (‘NB’) # оценить каждую модель для i в диапазоне (len (модели)): # оценить модель и сохранить результаты оценки = оценка_модель (X, y, модели [i]) полученные результаты.добавить (баллы) # подвести итоги и сохранить print (‘>% s% .3f (% .3f)’% (имена [i], среднее (баллы), стандартное (баллы))) # построить график результатов pyplot.boxplot (результаты, метки = имена, showmeans = True) pyplot.show ()

1

2

3

4

5

6

7

8

9

10

11

12

13

140002

18

19

20

21

22

23

24

25

26

27

28

29

30

000

000 34

35

36

37

38

39

40

41

42

43

44

45

46

49

0002 47

00030002 47

0003

51

52

53

54

55

56

57

58

59

60

61

62

63

9 0002 64

65

66

# сравнить вероятностную модель в наборе данных о разливе нефти

из numpy import mean

из numpy import std

из pandas import read_csv

из matplotlib import pyplot

from sklearn.предварительная обработка импорта LabelEncoder

от импорта sklearn.model_selection cross_val_score

от импорта sklearn.model_selection RepeatedStratifiedKFold

из sklearn.metrics импорта make_scorer

из sklearn.linear_model импорта логистической регрессии

из sklearn.discriminant_analysis импорта LinearDiscriminantAnalysis

из sklearn.naive_bayes импорта GaussianNB

из imblearn.metrics импортирует геометрический_mean_score

из sklearn.конвейерный импорт Pipeline

из sklearn.preprocessing import StandardScaler

# загрузить набор данных

def load_dataset (full_path):

# загрузить набор данных как массив numpy

data = read_csv (None_path, заголовок)

# удалить неиспользуемые столбцы

data.drop (22, axis = 1, inplace = True)

data.drop (0, axis = 1, inplace = True)

# получить массив numpy

data = data.values

# разделить на элементы ввода и вывода

X, y = data [:,: -1], data [:, -1]

# метка кодирует целевую переменную, чтобы иметь классы 0 и 1

y = LabelEncoder ().fit_transform (y)

return X, y

# оценить модель

def Assessment_model (X, y, model):

# определить процедуру оценки

cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1)

# определить метрику оценки модели

metric = make_scorer (geometry_mean_score)

# оценить модель

scores = cross_val_score (model, X, y, scoring = metric, cv = cv, n_jobs = -1)

оценки возврата

# определить местоположение набора данных

full_path = ‘oil-spill.csv ‘

# загрузить набор данных

X, y = load_dataset (full_path)

# определить модели

models, names, results = list (), list (), list ()

# LR

models. append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’))]))

names.append (‘LR’)

# LDA

models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LinearDiscriminantAnalysis ())]))

names.append (‘LDA’)

# NB

models.append (GaussianNB ())

names.append (‘NB’)

# оценить каждую модель

для i в диапазоне (len (models)):

# оценить модель и сохранить результаты

scores = eval_model ( X, y, модели [i])

results.append (scores)

# суммировать и сохранить

print (‘>% s% .3f (% .3f)’% (names [i], mean (scores) ), std (scores)))

# построить график результатов

pyplot.boxplot (results, labels = names, showmeans = True)

pyplot.показать ()

При выполнении примера оценивается каждая из вероятностных моделей в наборе данных.

Примечание : Ваши результаты могут отличаться из-за стохастической природы алгоритма или процедуры оценки или различий в числовой точности. Подумайте о том, чтобы запустить пример несколько раз и сравнить средний результат.

Вы можете увидеть некоторые предупреждения алгоритма LDA, такие как « Переменные коллинеарны ». На данный момент их можно спокойно игнорировать, но предполагается, что алгоритм может выиграть от выбора функции для удаления некоторых переменных.

В этом случае мы видим, что у каждого алгоритма есть навыки, достигающие среднего G-среднего выше 0,5. Результаты показывают, что LDA может быть лучшей из протестированных моделей.

> LR 0,621 (0,261) > LDA 0,741 (0,220) > NB 0,721 (0,197)

> LR 0,621 (0,261)

> LDA 0,741 (0,220)

> NB 0,721 (0,197)

Распределение G-средних баллов суммировано с использованием рисунка с прямоугольником и усами для каждого алгоритма.Мы можем видеть, что распределение как для LDA, так и для NB компактно и искусно, и что LR может иметь несколько результатов во время прогона, когда метод работает плохо, что приводит к снижению распределения.

Это подчеркивает, что при выборе модели следует учитывать не только среднюю производительность, но и согласованность модели.

Ящик и усовидный график вероятностных моделей в наборе данных по несбалансированным разливам нефти

У нас хорошее начало, но мы можем добиться большего.

Оценить сбалансированную логистическую регрессию

Алгоритм логистической регрессии поддерживает модификацию, которая регулирует важность ошибок классификации, чтобы она была обратно пропорциональна весу класса.

Это позволяет модели лучше изучить границу класса в пользу класса меньшинства, что может помочь в общей производительности G-среднего. Мы можем добиться этого, установив аргумент « class_weight » в LogisticRegression равным « сбалансирован, ».

… Логистическая регрессия (решатель = ‘liblinear’, class_weight = ‘сбалансированный’)

Логистическая регрессия (решатель = ‘liblinear’, class_weight = ‘сбалансированный’)

Как уже упоминалось, логистическая регрессия чувствительна к масштабу входных переменных и может лучше работать с нормализованными или стандартизованными входными данными; Таким образом, рекомендуется протестировать и то, и другое для данного набора данных.Кроме того, можно использовать распределение мощности, чтобы расширить распределение каждой входной переменной и сделать эти переменные с гауссовым распределением более гауссовским. Это может принести пользу моделям, таким как логистическая регрессия, которые делают предположения о распределении входных переменных.

Силовой транец будет использовать метод Йео-Джонсона, который поддерживает положительные и отрицательные входные данные, но мы также нормализуем данные перед преобразованием. Кроме того, класс PowerTransformer, используемый для преобразования, также стандартизирует каждую переменную после преобразования.

Мы сравним логистическую регрессию со сбалансированным взвешиванием классов с тем же алгоритмом с тремя различными схемами подготовки данных, а именно с нормализацией, стандартизацией и степенным преобразованием.

… # определить модели модели, имена, результаты = список (), список (), список () # LR Сбалансированный models.append (LogisticRegression (solver = ‘liblinear’, class_weight = ‘balance’)) names.append («Сбалансированный») # LR Сбалансированный + Нормализация модели.append (Pipeline (steps = [(‘t’, MinMaxScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight = ‘balance’))])) names.append (‘Сбалансированный-Норма’) # LR Сбалансированный + Стандартизация models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight = ‘balance’))])) names.append (‘Сбалансированный-стандартный’) # LR сбалансированный + мощность models.append (Pipeline (steps = [(‘t1’, MinMaxScaler ()), (‘t2’, PowerTransformer ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight = ‘balance’))] )) имена.append («Сбалансированная мощность»)

# define models

models, names, results = list (), list (), list ()

# LR Balanced

models.append (LogisticRegression (solver = ‘liblinear’, class_weight = ‘сбалансированный’))

names.append (‘Сбалансированный’)

# LR Сбалансированный + нормализация

models.append (Конвейер (шаги = [(‘t’, MinMaxScaler ()), (‘m’, LogisticRegression ( solver = ‘liblinear’, class_weight = ‘balance’))]))

имен.append (‘Balanced-Norm’)

# LR Balanced + Standardization

models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight). = ‘сбалансированный’))]))

names.append (‘Balanced-Std’)

# LR Balanced + Power

models.append (Pipeline (steps = [(‘t1’, MinMaxScaler ()), ( ‘t2’, PowerTransformer ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight = ‘Balanced’))]))

names.append (‘Balanced-Power’)

В совокупности ниже приведено сравнение сбалансированной логистической регрессии с различными схемами подготовки данных.

# сравнить сбалансированную логистическую регрессию с набором данных о разливе нефти из среднего значения импорта из numpy import std из панд импортировать read_csv из matplotlib import pyplot из sklearn.preprocessing import LabelEncoder из sklearn.model_selection импорт cross_val_score из sklearn.model_selection import RepeatedStratifiedKFold из sklearn.metrics импортировать make_scorer из sklearn.linear_model import LogisticRegression от imblearn.импорт метрик Geemetric_mean_score из sklearn.pipeline import Pipeline из sklearn.preprocessing import StandardScaler из sklearn.preprocessing import MinMaxScaler из sklearn.preprocessing import PowerTransformer # загрузить набор данных def load_dataset (полный_путь): # загружаем набор данных как массив numpy data = read_csv (полный_путь, заголовок = Нет) # удалить неиспользуемые столбцы data.drop (22, ось = 1, inplace = True) data.drop (0, ось = 1, inplace = True) # получить массив numpy данные = данные.ценности # разделить на элементы ввода и вывода X, y = данные [:,: -1], данные [:, -1] # метка кодирует целевую переменную, чтобы иметь классы 0 и 1 y = LabelEncoder (). fit_transform (y) вернуть X, y # оценить модель def оценивать_модель (X, y, модель): # определить процедуру оценки cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1) # определить метрику оценки модели metric = make_scorer (геометрическое_среднее_счет) # оценить модель оценки = cross_val_score (модель, X, y, оценка = метрика, cv = cv, n_jobs = -1) вернуть баллы # определить расположение набора данных full_path = ‘разлив нефти.csv ‘ # загрузить набор данных X, y = load_dataset (полный_путь) # определить модели модели, имена, результаты = список (), список (), список () # LR Сбалансированный models.append (LogisticRegression (solver = ‘liblinear’, class_weight = ‘balance’)) names.append («Сбалансированный») # LR Сбалансированный + Нормализация models.append (Pipeline (steps = [(‘t’, MinMaxScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight = ‘balance’))])) names.append (‘Сбалансированный-Норма’) # LR Сбалансированный + Стандартизация модели.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight = ‘balance’))])) names.append (‘Сбалансированный-стандартный’) # LR сбалансированный + мощность models.append (Pipeline (steps = [(‘t1’, MinMaxScaler ()), (‘t2’, PowerTransformer ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight = ‘balance’))] )) names.append (‘Сбалансированная мощность’) # оценить каждую модель для i в диапазоне (len (модели)): # оценить модель и сохранить результаты оценки = оценка_модель (X, y, модели [i]) полученные результаты.добавить (баллы) # подвести итоги и сохранить print (‘>% s% .3f (% .3f)’% (имена [i], среднее (баллы), стандартное (баллы))) # построить график результатов pyplot.boxplot (результаты, метки = имена, showmeans = True) pyplot.show ()

1

2

3

4

5

6

7

8

9

10

11

12

13

140002

18

19

20

21

22

23

24

25

26

27

28

29

30

000

000 34

35

36

37

38

39

40

41

42

43

44

45

46

49

0002 47

00030002 47

0003

51

52

53

54

55

56

57

58

59

60

61

62

63

9 0002 64

65

66

67

68

69

# сравнить сбалансированную логистическую регрессию в наборе данных о разливе нефти

из numpy import mean

из numpy import std

из pandas import read_csv

из matplotlib import pyplot

from sklearn.предварительная обработка импорт LabelEncoder

из sklearn.model_selection импорт cross_val_score

из sklearn.model_selection import RepeatedStratifiedKFold

из sklearn.metrics import make_scorer

из sklearn.linear_model import

Конвейер

из sklearn.preprocessing import StandardScaler

из sklearn.preprocessing import MinMaxScaler

из sklearn.предварительная обработка import PowerTransformer

# загрузить набор данных

def load_dataset (full_path):

# загрузить набор данных как массив numpy

data = read_csv (full_path, header = None)

columns

# drop unused data .drop (22, axis = 1, inplace = True)

data.drop (0, axis = 1, inplace = True)

# получить массив numpy

data = data.values ​​

# разделить на ввод и вывод elements

X, y = data [:,: -1], data [:, -1]

# метка кодирует целевую переменную, чтобы иметь классы 0 и 1

y = LabelEncoder ().fit_transform (y)

return X, y

# оценить модель

def Assessment_model (X, y, model):

# определить процедуру оценки

cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1)

# определить метрику оценки модели

metric = make_scorer (geometry_mean_score)

# оценить модель

scores = cross_val_score (model, X, y, scoring = metric, cv = cv, n_jobs = -1)

оценки возврата

# определить местоположение набора данных

full_path = ‘oil-spill.csv ‘

# загрузить набор данных

X, y = load_dataset (full_path)

# определить модели

models, names, results = list (), list (), list ()

# LR Balanced

models .append (LogisticRegression (solver = ‘liblinear’, class_weight = ‘сбалансированный’))

names.append (‘Balanced’)

# LR Balanced + Normalization

models.append (Pipeline (steps = [(‘t’) , MinMaxScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight = ‘balance’))]))

имен.append (‘Balanced-Norm’)

# LR Balanced + Standardization

models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight). = ‘сбалансированный’))]))

names.append (‘Balanced-Std’)

# LR Balanced + Power

models.append (Pipeline (steps = [(‘t1’, MinMaxScaler ()), ( ‘t2’, PowerTransformer ()), (‘m’, LogisticRegression (solver = ‘liblinear’, class_weight = ‘Balanced’))]))

names.append (‘Balanced-Power’)

# оценить каждую модель

for i in range (len (models)):

# оценить модель и сохранить результаты

scores = Assessment_model (X, y, models [i])

results.append (scores)

# суммировать и сохранить

print (‘>% s% .3f (% .3f)’% (names [i], mean (scores), std (scores)))

# построить график результаты

pyplot.boxplot (результаты, метки = имена, showmeans = True)

pyplot.show ()

При выполнении примера оценивается каждая версия модели сбалансированной логистической регрессии в наборе данных.

Примечание : Ваши результаты могут отличаться из-за стохастической природы алгоритма или процедуры оценки или различий в числовой точности.Подумайте о том, чтобы запустить пример несколько раз и сравнить средний результат.

Вы можете увидеть некоторые предупреждения от первой сбалансированной модели LR, такие как « Liblinear не удалось сходиться ». Эти предупреждения пока можно проигнорировать, но предполагают, что алгоритм может выиграть от выбора функции для удаления некоторых переменных.

В этом случае мы видим, что сбалансированная версия логистической регрессии работает намного лучше, чем все вероятностные модели, оцененные в предыдущем разделе.

Результаты показывают, что, возможно, использование сбалансированного LR с нормализацией данных для предварительной обработки лучше всего работает с этим набором данных со средним значением G-среднего около 0,852. Это находится в диапазоне или лучше, чем результаты, представленные в статье 1998 года.

> Сбалансированный 0,846 (0,142) > Сбалансированный-Норма 0,852 (0,119) > Сбалансированный-стандартный 0,843 (0,124) > Сбалансированная мощность 0,847 (0,130)

> Сбалансированный 0.846 (0,142)

> сбалансированный-нормальный 0,852 (0,119)

> сбалансированный-стандартный 0,843 (0,124)

> сбалансированный-мощный 0,847 (0,130)

Для каждого алгоритма создается фигура с диаграммами в виде ящиков и усов, что позволяет сравнивать распределение результатов.

Мы видим, что распределение для сбалансированного LR в целом более жесткое, чем для несбалансированной версии в предыдущем разделе. Мы также можем видеть, что средний результат (оранжевая линия) для нормализованной версии выше среднего, выше 0.9, что впечатляет. Среднее значение, отличное от медианы, предполагает асимметричное распределение результатов, понижающее среднее значение с несколькими плохими результатами.

Ящик и усовидный график моделей сбалансированной логистической регрессии в наборе данных по несбалансированным разливам нефти

Теперь у нас есть отличные результаты с небольшой работой; посмотрим, сможем ли мы сделать еще один шаг вперед.

Оценка выборки данных с помощью вероятностных моделей

Выборка данных позволяет лучше подготовить несбалансированный набор обучающих данных перед подгонкой модели.

Возможно, самой популярной выборкой данных является метод передискретизации SMOTE для создания новых синтетических примеров для класса меньшинства. Это может быть объединено с алгоритмом отредактированного ближайшего соседа (ENN), который будет находить и удалять примеры из набора данных, которые являются неоднозначными, что упрощает обучение моделей различать два класса.

Эта комбинация называется SMOTE-ENN и может быть реализована с использованием класса SMOTEENN из библиотеки imbalanced-learn; например:

… # определить метод выборки данных SMOTE-ENN e = SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’)))

# определить метод выборки данных SMOTE-ENN

e = SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’)))

SMOTE и ENN работают лучше, если входные данные масштабируются заранее. Это связано с тем, что оба метода включают внутреннее использование алгоритма ближайшего соседа, и этот алгоритм чувствителен к входным переменным с разными масштабами.Следовательно, нам потребуется нормализовать данные в качестве первого шага, затем выполнить их выборку, а затем использовать в качестве входных данных для (несбалансированной) модели логистической регрессии.

Таким образом, мы можем использовать класс Pipeline, предоставляемый библиотекой imbalanced-learn, для создания последовательности преобразований данных, включая метод выборки данных, и заканчивая моделью логистической регрессии.

Мы сравним четыре варианта модели логистической регрессии с выборкой данных, а именно:

  • SMOTEENN + LR
  • Нормализация + SMOTEENN + LR
  • Стандартизация + SMOTEENN + LR
  • Нормализация + Питание + SMOTEENN + LR

Ожидается, что LR будет работать лучше с SMOTEENN, и что SMOTEENN будет лучше работать со стандартизацией или нормализацией.Последний случай делает многое: сначала нормализует набор данных, затем применяет преобразование мощности, стандартизирует результат (напомним, что класс PowerTransformer стандартизирует вывод по умолчанию), применяет SMOTEENN, а затем, наконец, подбирает модель логистической регрессии.

Эти комбинации можно определить следующим образом:

… # SMOTEENN models.append (Pipeline (steps = [(‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m’, LogisticRegression (solver = ‘liblinear’))])) имена.добавить (‘LR’) # SMOTEENN + Норма models.append (Pipeline (steps = [(‘t’, MinMaxScaler ()), (‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m’, LogisticRegression (solver = ‘liblinear ‘))])) names.append (‘Норма’) # SMOTEENN + Std models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m’, LogisticRegression (solver = ‘liblinear ‘))])) names.append (‘Стандартное’) # SMOTEENN + Мощность модели.append (Pipeline (steps = [(‘t1’, MinMaxScaler ()), (‘t2’, PowerTransformer ()), (‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m ‘, LogisticRegression (solver =’ liblinear ‘))])) names.append (‘Власть’)

# SMOTEENN

models.append (Pipeline (steps = [(‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m’, LogisticRegression (solver = ‘ liblinear ‘))]))

имен.append (‘LR’)

# SMOTEENN + Norm

models.append (Pipeline (steps = [(‘t’, MinMaxScaler ()), (‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’)) )), (‘m’, LogisticRegression (solver = ‘liblinear’))]))

names.append (‘Norm’)

# SMOTEENN + Std

models.append (Pipeline (steps = [(‘t ‘, StandardScaler ()), (‘ e ‘, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy =’ most ‘))), (‘ m ‘, LogisticRegression (solver =’ liblinear ‘))]))

имен.append (‘Std’)

# SMOTEENN + Power

models.append (Pipeline (steps = [(‘t1’, MinMaxScaler ()), (‘t2’, PowerTransformer ()), (‘e’, SMOTEENN ( enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m’, LogisticRegression (solver = ‘liblinear’))]))

names.append (‘Power’)

Полный пример приведен ниже.

# сравнить выборку данных с логистической регрессией в наборе данных о разливе нефти из среднего значения импорта из numpy import std из панд импортировать read_csv из matplotlib import pyplot из склеарна.предварительная обработка импорта LabelEncoder из sklearn.model_selection импорт cross_val_score из sklearn.model_selection import RepeatedStratifiedKFold из sklearn.metrics импортировать make_scorer из sklearn.linear_model import LogisticRegression из imblearn.metrics import geometry_mean_score из sklearn.preprocessing import PowerTransformer из sklearn.preprocessing import StandardScaler из sklearn.preprocessing import MinMaxScaler from imblearn.pipeline import Pipeline от imblearn.объединить импорт SMOTEENN из imblearn.under_sampling import EditedNearestNeighbours # загрузить набор данных def load_dataset (полный_путь): # загружаем набор данных как массив numpy data = read_csv (полный_путь, заголовок = Нет) # удалить неиспользуемые столбцы data.drop (22, ось = 1, inplace = True) data.drop (0, ось = 1, inplace = True) # получить массив numpy data = data.values # разделить на элементы ввода и вывода X, y = данные [:,: -1], данные [:, -1] # метка кодирует целевую переменную, чтобы иметь классы 0 и 1 y = LabelEncoder ().fit_transform (y) вернуть X, y # оценить модель def оценивать_модель (X, y, модель): # определить процедуру оценки cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1) # определить метрику оценки модели metric = make_scorer (геометрическое_среднее_счет) # оценить модель оценки = cross_val_score (модель, X, y, оценка = метрика, cv = cv, n_jobs = -1) вернуть баллы # определить расположение набора данных full_path = ‘разлив нефти.csv ‘ # загрузить набор данных X, y = load_dataset (полный_путь) # определить модели модели, имена, результаты = список (), список (), список () # SMOTEENN models.append (Pipeline (steps = [(‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m’, LogisticRegression (solver = ‘liblinear’))])) names.append (‘LR’) # SMOTEENN + Норма models.append (Pipeline (steps = [(‘t’, MinMaxScaler ()), (‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m’, LogisticRegression (solver = ‘liblinear ‘))])) имена.append (‘Норма’) # SMOTEENN + Std models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m’, LogisticRegression (solver = ‘liblinear ‘))])) names.append (‘Стандартное’) # SMOTEENN + Мощность models.append (Pipeline (steps = [(‘t1’, MinMaxScaler ()), (‘t2’, PowerTransformer ()), (‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), ( ‘m’, LogisticRegression (solver = ‘liblinear’))])) names.append (‘Власть’) # оценить каждую модель для i в диапазоне (len (модели)): # оценить модель и сохранить результаты оценки = оценка_модель (X, y, модели [i]) # подвести итоги и сохранить print (‘>% s%.3f (% .3f) ‘% (имена [i], среднее (баллы), стандартное (баллы))) results.append (баллы) # построить график результатов pyplot.boxplot (результаты, метки = имена, showmeans = True) pyplot.show ()

1

2

3

4

5

6

7

8

9

10

11

12

13

140002

18

19

20

21

22

23

24

25

26

27

28

29

30

000

000 34

35

36

37

38

39

40

41

42

43

44

45

46

49

0002 47

00030002 47

0003

51

52

53

54

55

56

57

58

59

60

61

62

63

9 0002 64

65

66

67

68

69

70

71

# сравните выборку данных с логистической регрессией в наборе данных о разливе нефти

из numpy import mean

из numpy import std

из pandas import read_csv

из matplotlib import pyplot

from sklearn.предварительная обработка импорт LabelEncoder

из sklearn.model_selection импорт cross_val_score

из sklearn.model_selection импорт RepeatedStratifiedKFold

из sklearn.metrics импорт make_scorer

из sklearn.blearn.metrics импорт

из sklearn. PowerTransformer

из sklearn.preprocessing import StandardScaler

из sklearn.предварительная обработка импорт MinMaxScaler

из imblearn.pipeline import Pipeline

из imblearn.combine import SMOTEENN

from imblearn.under_sampling import EditedNearestNeighbours

# load the dataset 9000_dataset

массив numpy

data = read_csv (full_path, header = None)

# удалить неиспользуемые столбцы

data.drop (22, axis = 1, inplace = True)

data.drop (0, axis = 1, inplace = True)

# получить массив numpy

data = data.values ​​

# разделить на элементы ввода и вывода

X, y = data [:,: -1], data [:, -1]

# label кодирует целевую переменную, чтобы иметь классы 0 и 1

y = LabelEncoder (). Fit_transform (y)

return X, y

# оценить модель

def Assessment_model (X, y, model):

# определить процедуру оценки

cv = RepeatedStratifiedKFold (n_splits = 10, n_repeats = 3, random_state = 1)

# определить метрику оценки модели

metric = make_scorer (geometry_mean_mean_mean)

# оценить модель

scores = cross_val_score (model, X, y, scoring = metric, cv = cv, n_jobs = -1)

return scores

# определить местоположение набора данных

full_path = ‘oil -проливать.csv ‘

# загрузить набор данных

X, y = load_dataset (full_path)

# определить модели

models, names, results = list (), list (), list ()

# SMOTEENN

models. append (Pipeline (steps = [(‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))), (‘m’, LogisticRegression (solver = ‘liblinear’))]))

names.append ( ‘LR’)

# SMOTEENN + Norm

models.append (Pipeline (steps = [(‘t’, MinMaxScaler ()), (‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))) , (‘m’, LogisticRegression (solver = ‘liblinear’))]))

имен.append (‘Norm’)

# SMOTEENN + Std

models.append (Pipeline (steps = [(‘t’, StandardScaler ()), (‘e’, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’)) )), (‘m’, LogisticRegression (solver = ‘liblinear’))]))

names.append (‘Std’)

# SMOTEENN + Power

models.append (Pipeline (steps = [(‘t1 ‘, MinMaxScaler ()), (‘ t2 ‘, PowerTransformer ()), (‘ e ‘, SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy =’ most ‘))), (‘ m ‘, LogisticRegression (solver =’ liblinear ‘) )]))

фамилии.append (‘Power’)

# оценить каждую модель

for i in range (len (models)):

# оценить модель и сохранить результаты

scores = eval_model (X, y, models [i])

# суммировать и сохранить

print (‘>% s% .3f (% .3f)’% (names [i], mean (scores), std (scores)))

results.append (scores)

# построить график результатов

pyplot.boxplot (results, labels = names, showmeans = True)

pyplot.show ()

При выполнении примера оценивается каждая версия SMOTEENN с моделью логистической регрессии в наборе данных.

Примечание : Ваши результаты могут отличаться из-за стохастической природы алгоритма или процедуры оценки или различий в числовой точности. Подумайте о том, чтобы запустить пример несколько раз и сравнить средний результат.

В этом случае мы видим, что добавление SMOTEENN улучшает производительность алгоритма LR по умолчанию, достигая среднего G-среднего 0,852 по сравнению с 0,621, наблюдаемого в первом наборе экспериментальных результатов. Это даже лучше, чем сбалансированный LR без какого-либо масштабирования данных (предыдущий раздел), который достиг среднего G около 0.846.

Результаты показывают, что, возможно, окончательная комбинация нормализации, преобразования мощности и стандартизации дает немного лучший результат, чем LR по умолчанию с SMOTEENN со средним G около 0,873, хотя предупреждающие сообщения указывают на некоторые проблемы, которые необходимо устранить. .

> LR 0,852 (0,105) > Норма 0,838 (0,130) > Стандартное 0,849 (0,113) > Мощность 0,873 (0,118)

> LR 0.852 (0,105)

> Норма 0,838 (0,130)

> Стандартная 0,849 (0,113)

> Мощность 0,873 (0,118)

Распределение результатов можно сравнить с диаграммами ящиков и усов. Мы видим, что все распределения имеют примерно одинаковый узкий спред, и что разницу в средних значениях результатов можно использовать для выбора модели.

Ящик и усовидный график моделей логистической регрессии с выборкой данных из несбалансированного набора данных о разливе нефти

Сделайте прогноз на основе новых данных

Использование SMOTEENN с логистической регрессией напрямую без какого-либо масштабирования данных, вероятно, обеспечивает простейшую и хорошо работающую модель, которую можно было бы использовать в будущем.

У этой модели среднее G-среднее около 0,852 на нашем тестовом жгуте.

Мы будем использовать это в качестве нашей окончательной модели и использовать ее для прогнозирования новых данных.

Во-первых, мы можем определить модель как конвейер.

… # определить модель smoteenn = SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’)) model = LogisticRegression (решатель = ‘liblinear’) pipeline = Pipeline (steps = [(‘e’, smoteenn), (‘m’, model)])

# определить модель

smoteenn = SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))

model = LogisticRegression (solver = ‘liblinear’)

pipeline = Pipeline (steps = [(‘e’ , smoteenn), (‘m’, модель)])

После определения мы можем разместить его на всем наборе обучающих данных.

… # соответствовать модели pipeline.fit (X, y)

# подходит для модели

pipeline.fit (X, y)

После подбора мы можем использовать его для прогнозирования новых данных, вызвав функцию pred () . Это вернет метку класса 0 для отсутствия разлива нефти или 1 для разлива нефти.

Например:

… # определяем строку данных row = […] # сделать прогноз yhat = pipeline.predict ([строка]) # получить этикетку label = yhat [0]

# определить строку данных

row = […]

# сделать прогноз

yhat = pipeline.predict ([row])

# получить метку

label = yhat [0]

Чтобы продемонстрировать это, мы можем использовать подобранную модель, чтобы сделать некоторые прогнозы этикеток для нескольких случаев, когда мы знаем, что разлива нефти нет, и нескольких случаев, когда мы знаем, что он есть.

Полный пример приведен ниже.

# подобрать модель и сделать прогнозы для набора данных о разливе нефти из панд импортировать read_csv из склеарна.предварительная обработка импорта LabelEncoder из sklearn.linear_model import LogisticRegression from imblearn.pipeline import Pipeline from imblearn.combine import SMOTEENN из imblearn.under_sampling import EditedNearestNeighbours # загрузить набор данных def load_dataset (полный_путь): # загружаем набор данных как массив numpy data = read_csv (полный_путь, заголовок = Нет) # получить массив numpy data = data.values # разделить на элементы ввода и вывода X, y = данные [:, 1: -1], данные [:, -1] # метка кодирует целевую переменную, чтобы иметь классы 0 и 1 y = LabelEncoder ().fit_transform (y) вернуть X, y # определить расположение набора данных full_path = ‘oil-spill.csv’ # загрузить набор данных X, y = load_dataset (полный_путь) # определить модель smoteenn = SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’)) model = LogisticRegression (решатель = ‘liblinear’) pipeline = Pipeline (steps = [(‘e’, smoteenn), (‘m’, model)]) # соответствовать модели pipeline.fit (X, y) # оценить некоторые случаи неразливания (известный класс 0) print (‘Случаи неразливания:’) данные = [[329,1627.54,1409.43,51,822500,35,6.1,4610,0.17,178.4,0.2,0.24,0.39,0.12,0.27,138.32,34.81,2.02,0.14,0.19,75.26,0,0.47,351.67,0.18,9.24, 0,38,2,57, -2,96, -0,28,1,93,0,1,93,34,1710,0,25,84,78,55,1460,31,710,63,451,78,150,85,3,23,0,4530,75,66,25,7,85], [3234,1091.56,1357.96,32,8085000,40.08,8.98,25450,0.22,317.7,0.18,0.2,0.49,0.09,0.41,114.69,41.87,2.31,0.15,0.18,75.26,0,0,53,351.67,0.18 , 9,24,0,24,3,56, -3,09, -0,31,2,17,0,2,17,281,14490,0,80,11,78,55,4287,77,3095,56,1937,42,773,69,2,21,0,4927,51,66,15,7,24], [2339,1537.68,1633.02,45,5847500,38.13,9.29,22110,0.24,264.5,0.21,0.26,0.79,0.08,0.71,89.49,32.23,2.2,0.17,0.22,75.26,0,0.51,351.67,0.18,9.24, 0,27,4,21, -2,84, -0,29,2,16,0,2,16,228,12150,0,83,6,78,55,3959,8,2404,16,1530,38,659,67,2,59,0,4732,04,66,34,7,67]] для строки в данных: # сделать прогноз yhat = pipeline.predict ([строка]) # получить этикетку label = yhat [0] # суммировать print (‘> Прогноз =% d (ожидается 0)’% (метка)) # оценить некоторые случаи разлива (известный класс 1) print (‘Случаи разлива:’) данные = [[2971,1020.91,630,8,59,7427500,32.76,10.48,17380,0.32,427.4,0.22,0.29,0.5,0.08,0.42,149.87,50.99,1.89,0.14,0.18,75.26,0,0.44,351.67,0.18,9.24,2.5, 10,63, -3,07, -0,28,2,18,0,2,18,164,8730,0,40,67,78,55,5650,88,1749,29,1245,07,348,7,4,54,0,25579,34,65,78,7,41], [3155,1118.08,469.39,11,7887500,30.41,7.99,15880,0.26,496.7,0.2,0.26,0.69,0.11,0.58,118.11,43.96,1.76,0.15,0.18,75.26,0,0.4,351.67,0.18 , 9,24,0,78,8,68, -3,19, -0,33,2,19,0,2,19,150,8100,0,31,97,78,55,3471,31,3059,41,2043,9,477,23,1,7,0,28172,07,65,72,7.58], [115,1449.85,608.43,88,287500,40.42,7.34,3340,0.18,86.1,0.21,0.32,0.5,0.17,0.34,71.2,16.73,1.82,0.19,0.29,87.65,0,0.46,132.78, — 0,01,3,78,0,7,4,79, -3,36, -0,23,1,95,0,1,95,29,1530,0,01,38,8,89,69,1400,250,150,45,13,9,33,1,31692,84,65,81,7,84]] для строки в данных: # сделать прогноз yhat = pipeline.predict ([строка]) # получить этикетку label = yhat [0] # суммировать print (‘> Прогноз =% d (ожидается 1)’% (метка))

1

2

3

4

5

6

7

8

9

10

11

12

13

140002

14

18

19

20

21

22

23

24

25

26

27

28

29

30

000

000 34

35

36

37

38

39

40

41

42

43

44

45

46

49

0002 47

00030002 47

0003

51

52

53

54

# подобрать модель и сделать прогнозы для набора данных о разливе нефти

из pandas import read_csv

из sklearn.предварительная обработка import LabelEncoder

из sklearn.linear_model import LogisticRegression

из imblearn.pipeline import Pipeline

из imblearn.combine import SMOTEENN

из imblearn.under_sampling import EditedNearest 9_Neighbours 9_0003 defitase2000 :

# загрузить набор данных как массив numpy

data = read_csv (full_path, header = None)

# получить массив numpy

data = data.values ​​

# разделение на элементы ввода и вывода

X, y = data [:, 1: -1], data [:, -1]

# метка кодирует целевую переменную, чтобы иметь классы 0 и 1

y = LabelEncoder (). fit_transform (y)

return X, y

# определить местоположение набора данных

full_path = ‘oil-spill.csv’

# загрузить набор данных

X, y = load_dataset (full_path)

# определить модель

smoteenn = SMOTEENN (enn = EditedNearestNeighbours (sampling_strategy = ‘most’))

model = LogisticRegression (solver = ‘liblinear’)

pipeline [= Pipeline e ‘, smoteenn), (‘ m ‘, model)])

# подходит для трубопровода модели

.fit (X, y)

# оценка некоторых случаев неразливания (известный класс 0)

print (‘Non-spill Cases:’)

data = [[329,1627.54,1409.43,51,822500,35 , 6.1,4610,0.17,178.4,0.2,0.24,0.39,0.12,0.27,138.32,34.81,2.02,0.14,0.19,75.26,0,0,47,351.67,0.18,9.24,0.38,2.57, -2.96, -0.28 , 1,93,0,1,93,34,1710,0,25,84,78,55,1460,31,710,63,451,78,150,85,3,23,0,4530,75,66,25,7,85],

[3234,1091.56,1357.96,32,8085000 , 40.08,8.98,25450,0.22,317.7,0.18,0.2,0.49,0.09,0.41,114.69,41.87,2.31,0.15,0.18,75.26,0,0.53,351.67,0.18,9.24,0.24,3.56, -3.09, -0.31,2.17,0,2.17,281,14490,0,80.11,78,55,4287.77,3095.56,1937.42, 773.69,2.21,0,4927.51,66.15,7.24],

[2339,1537.68,1633.02,45,5847500,38,13,9.29,22110,0.24,264.5,0.21,0.26,0.79,0.08,0.71,89.49,32.23, 2,2,0,17,0,22,75,26,0,0,51,351,67,0,18,9,24,0,27,4,21, -2,84, -0,29,2,16,0,2,16,228,12150,0,83,6,78,55,3959,8,2404,16, 1530.38,659.67,2.59,0,4732.04,66.34,7.67]]

для строки в данных:

# сделать прогноз

yhat = pipeline.прогноз ([строка])

# получить метку

label = yhat [0]

# суммировать

print (‘> Прогнозируемый =% d (ожидаемый 0)’% (метка))

# оценить некоторые случаи разлива (известный класс 1)

print (‘Случаи разлива:’)

данные = [[2971,1020.91,630.8,59,7427500,32.76,10.48,17380,0.32,427.4,0.22,0.29,0.5,0.08 , 0,42,149,87,50,99,1,89,0,14,0,18,75,26,0,0,44,351,67,0,18,9,24,2,5,10,63, -3,07, -0,28,2,18,0,2,18,164,8730,0,40,67,78 , 55,5650,88,1749,29,1245,07,348.7,4.54,0,25579.34,65.78,7.41],

[3155,1118.08,469.39,11,7887500,30.41,7.99,15880,0.26,496.7,0.2,0.26,0.69,0.11,0.58,118.11,43.96, 1,76,0,15,0,18,75,26,0,0,4,351,67,0,18,9,24,0,78,8,68, -3,19, -0,33,2,19,0,2,19,150,8100,0,31.97,78,55,3471,31,3059,41, 2043.9,477.23,1.7,0,28172.07,65.72,7.58],

[115,1449.85,608.43,88,287500,40.42,7.34,3340,0.18,86.1,0.21,0.32,0.5,0.17,0.34,71.2, 16.73,1.82,0.19,0.29,87.65,0,0.46,132.78, -0.01,3.78,0.7,4.79, -3.36, -0.23,1.95,0,1.95,29,1530,0.01,38.8,89,69,1400,250,150,45.13,9.33,1,31692.84,65.81,7.84]]

для строки в данных:

# сделать прогноз

yhat = pipeline.predict ([row])

# получить этикетку

label = yhat [0]

# суммировать

print (‘> Прогнозируемый =% d (ожидаемый 1)’% (label))

При первом запуске примера модель соответствует всему набору обучающих данных.

Затем подходящая модель, используемая для прогнозирования метки разлива нефти для случаев, когда мы знаем, что ее нет, выбирается из файла набора данных.Мы видим, что все случаи предсказаны правильно.

Затем некоторые случаи реальных разливов нефти используются в качестве входных данных для модели, и прогнозируется этикетка. Как мы могли надеяться, снова предсказываются правильные метки.

Случаи неразливаемости: > Прогнозируемый = 0 (ожидаемый 0) > Прогнозируемый = 0 (ожидаемый 0) > Прогнозируемый = 0 (ожидаемый 0) Случаи разлива: > Прогнозируемый = 1 (ожидаемый 1) > Прогнозируемый = 1 (ожидаемый 1) > Прогнозируемый = 1 (ожидаемый 1)

Случаи разлива:

> Прогнозируемый = 0 (ожидаемый 0)

> Прогнозируемый = 0 (ожидаемый 0)

> Прогнозируемый = 0 (ожидаемый 0)

Случаи разлива:

> Прогнозируемый = 1 (ожидаемый 1)

> Прогнозируемый = 1 (ожидаемый 1)

> Прогнозируемый = 1 (ожидаемый 1)

Дополнительная литература

Этот раздел предоставляет дополнительные ресурсы по теме, если вы хотите углубиться.

Документы

API

Статьи

Сводка

В этом руководстве вы узнали, как разработать модель для прогнозирования наличия разлива нефти на спутниковых снимках и оценить его с помощью показателя G-среднего.

В частности, вы выучили:

  • Как загрузить и изучить набор данных и выработать идеи для подготовки данных и выбора модели.
  • Как оценить набор вероятностных моделей и повысить их производительность с помощью соответствующей подготовки данных.
  • Как подогнать окончательную модель и использовать ее для прогнозирования меток классов для конкретных случаев.

Есть вопросы?
Задайте свои вопросы в комментариях ниже, и я постараюсь ответить.

Разберитесь с несбалансированной классификацией!

Разработка несбалансированных моделей обучения за считанные минуты

… всего несколькими строками кода Python

Узнайте, как в моей новой электронной книге:
Несбалансированная классификация с Python

Он предоставляет руководств для самообучения и сквозных проектов на:
Показатели производительности , Методы пониженной выборки , SMOTE , Смещение порога , Калибровка вероятности , Алгоритм с учетом затрат
и многое другое.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *