Левин М. Ю., Шкатов В.В. Применение нейронных сетей для

реклама
УДК 681.3
ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ПРОГНОЗИРОВАНИЯ
МЕХАНИЧЕСКИХ СВОЙСТВ ГОРЯЧЕКАТАНОЙ ЛИСТОВОЙ
СТАЛИ
Липецкий государственный технический университет
М. Ю. Левин, В. В. Шкатов
Изучено влияние архитектуры многослойной персептронной сети на результаты прогноза предела прочности,
предела текучести и относительного удлинения горячекатаных листовых сталей по их химическому составу и
параметрам горячей прокатки на стане 2000. Определена архитектура нейронной сети, обеспечивающая наименьшую ошибку прогноза.
Производство горячего проката представляет собой сложный процесс, характеризующийся большим количеством технологических факторов. На механические
свойства горячекатаных полос влияют химический состав и структура металла,
формирование которой определяется температурно-деформационными
режимами
прокатки [1], причем закономерности этого
влияния имеют сложный характер.
В литературе описаны практические
разработки применения нейронных сетей
для моделирования различного рода инженерных систем [2]. Показано, что нейросетевые модели – это универсальный механизм для моделирования функций и классификации объектов. Нейронные сети –
исключительно мощный метод моделирования, позволяющий воспроизводить чрезвычайно сложные зависимости. В частности, нейронные сети нелинейны по своей
природе [2, 3, 4].
Целью настоящей работы является исследование влияния количества слоев, количества нейронов в слое и вида функций
активаций нейронов персептронной сети на
результаты прогноза характеристик механических свойств горячекатаных полос из
углеродистых и низколегированных сталей
по параметрам их прокатки и химическому
составу сталей.
Для оценки эффективности прогноза
механических свойств многослойной ней-
ронной сетью с различной архитектурой был
использован массив экспериментальных
данных
о
химическом
составе,
технологических параметрах прокатки и
результатах
сдаточных
механических
испытаний 10 000 горячекатаных полос из
20
марок
углеродистых
и
низколегированных сталей, прокатанных на
широкополосном стане 2000 (табл. 1).
В качестве входных параметров нейронной сети были выбраны следующие параметры, влияющие на свойства и структуру
стали: толщина сляба; толщина, ширина и
длина готовой полосы; усилие прокатки по
клетям чистовой группы (клети № 06-12) и
скорость прокатки в последней клети, характеризующие
деформационноскоростной режим прокатки; параметры, характеризующие температурный режим деформации и охлаждения полосы (температура
за 5 клетью, температура конца прокатки,
температура смотки полосы в рулон).
Помимо этого, было учтено влияние содержания в стали химических элементов:
марганца, кремния, серы, фосфора, никеля,
хрома, меди, алюминия, азота, углерода,
титана, ванадия и ниобия.
Массив экспериментальных данных разбивали на две части. Первая служила для
обучения нейронной сети, а вторая контролирующей выборкой
Таблица 1
Статистические параметры массива горячекатаных полос углеродистых и низколегированных
сталей
Максимальное
Среднее знаМинимальное знаПараметр массива
значение парачение парачение параметра
метра
метра
Содержание
Углерод (C), %
0,007
0,24
0,10
химических
Магний (Mn), %
0,12
1,68
0,41
элементов
Кремний (Si), %
0,008
0,66
0,12
Сера (S), %
0,007
0,05
0,02
Фосфор (P), %
0,007
0,04
0,01
Никель (Ni), %
0,008
0,11
0,03
Хром (Cr), %
0,01
0,15
0,03
Медь (Cu), %
0,01
0,27
0,05
Алюминий (Al), %
0,01
0,12
0,05
Азот (N), %
0,002
0,009
0,005
Температура
за 5 клетью, °C
948
1048
1014
конца прокатки, °C
767
901
822
смотки, °C
640
743
6489
Толщина
сляба, мм
200
250
247
готовой полосы, мм
1,31
3,65
2,27
Ширина подката, мм
990
1596
1235
Длина полосы, м
345
1854
1092
Скорость клети № 12, м/мин
385
783
658
Предел
205
465
317
текучести т, МПа
298,9
590
406
прочности в, МПа
Относительное удлинение δ5, %
23,5
50
36
Контролирующая выборка использованый персептрон может обучаться быстрее,
лась для определения момента переобучеесли сигмоидальная функция активации
ния нейронной сети, когда среднеквадраявляется антисимметричной, а не симметтичная ошибка обучения уменьшается, а
ричной. К антисимметричной функции отсреднеквадратичная ошибка контролиносится гиперболический тангенс, формула
рующей выборки начинает возрастать. В
гиперболического тангенса в общем виде
этом случае процесс обучения нейронной
сети останавливали.
y = a∙th(b∙x),
Структурная идентификация нейросетегде a и b – константы.
вой модели состоит в выборе используеПрактически важными значениями для
мых функций активации, количества слоев
констант a и b являются следующие: a =
сети и количества нейронов в каждом слое
1,7159 и b = 2/3. Определенная таким обра[2].
зом функция гиперболического тангенса
Функции активации чаще всего выбиимеет ряд полезных свойств [3].
рают одинаковыми для всех формальных
Строго определенной процедуры для вынейронов, входящих в сеть. Такая сеть набора количества нейронов и количества слозывается однородной. Выбор вида функции
ев в сети нет. Чем больше количество нейактивации зависит от задач, для решения
ронов и слоев, тем шире возможности сети в
которых предполагается использовать синсмысле отражения сложных зависимостей
тезируемую нейросетевую модель. Обычно
нелинейного типа между входом и выходом.
в качестве функции активации выбирают
Однако это влечет снижение интенсивности
логистическую функцию или гиперболичееѐ обучения и темпа работы.
ский тангенс. Эти функции применимы для
При определении количества нейронов и
широкого круга задач [3, 4]. Многослойслоев приходится учитывать множество
факторов: сложность решаемой задачи, объемы имеющихся данных для обучения, количество требуемых входов и выходов сети,
объемы ресурсов вычислительного устройства (память и быстродействие), на котором
синтезируется сеть, моделирующая объект
[2, 4].
В работе строились персептронные сети с
одним и двумя скрытыми слоями. Количество
нейронов изменялось от 53 (значение рассчитывалось по теореме Колмогорова [2]) до 13.
Минимальное значение выбрано как число
входных параметров нейронной сети, деленное на два.
Таблица 2
Результаты прогнозирования характеристик механических свойств нейронными сетями с
различной архитектурой
Среднеквадратичная ошибка прогноза
Вид сети
По обучающей выборке
По контролирующей
выборке
По всей выборке
в,
МПа
т,
МПа
δ5, %
в,
МПа
т,
МПа
δ5, %
в,
МПа
т,
МПа
δ5, %
26-13-1
18,86
25,35
3,46
19,54
26,99
3,55
19,28
26,19
3,54
26-13-1 TH
19,29
25,43
3,53
19,27
26,77
3,55
19,28
26,11
3,54
26-13-13-1
18,96
25,78
3,51
19,50
27,13
3,56
19,08
26,45
3,54
26-13-13-1 TH
18,45
24,61
3,49
19,48
27,77
3,56
18,93
26,1
3,52
26-53-1
18,63
24,19
3,20
20,87
29,17
3,74
19,73
27,47
3,66
Среднеквадратичная ошибка прогноза, МПа
19,8
19,6
19,4
19,2
19
18,8
18,6
18,4
26-13-1
26-13- 1 TH
26-13-13-1 26-13-13- 1 TH
26-53-1
Вид сети
Рис. Значение среднеквадратичной ошибки прогноза предела прочности для нейронных
сетей с различной архитектурой
Была проведена оценка влияния на ошибку
прогноза механических свойств сталей двух
типов функций активации нейронов: сигмоидальной биполярной функции и гиперболического тангенса с параметрами (a = 1,7159 и b =
2/3).
Результаты обучения нейронной сети и
прогнозирования механических свойств по
обученной нейронной сети с различной архитектурой приведены в табл. 2.
В кодовом обозначении «Вид сети» первые
цифры обозначают количество входных параметров, последние – количество выходов;
вторая и третья цифры показывают количество слоев и количество нейронов в слое, соответственно. TH – кодовое обозначение гиперболического тангенса с параметрами a =
1,7159 и b = 2 / 3, выбранного в качестве
функции активации нейронов. Отсутствие кодового обозначения показывает, что использовалась сигмоидальная биполярная функция
активации нейронов
Сравнение среднеквадратичных ошибок
прогноза механических свойств сталей с использованием нейронной сети с различной
архитектурой показало, что увеличение количества нейронов в скрытом слое с 13 до 53 не
дало ожидаемого результата по повышению
точности прогноза. Это может быть связано с
накоплением внутренней ошибки нейронной
сети из-за большего числа связей между нейронами.
Для всех исследуемых характеристик механических свойств стали (предела текучести,
предела прочности, относительного удлинения) лучший результат показала нейронная
сеть с двумя скрытыми слоями, тринадцатью
нейронами
в
скрытом
слое
и
гиперболическим тангенсом в качестве
функции активации (рис.).
Таким образом, нейронная сеть способна
прогнозировать механические свойства горячекатаной стали с достаточно высокой точностью и может быть использована для оптимизации режимов прокатки.
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1. Коцарь, С.Л. Технология листопрокатного производства [Текст]/ С. Л. Коцарь, А. Д.
Белянский, Ю. А. Мухин. – М. Металлургия,
1997. – 272с.
2. Оссовский, С. Нейронные сети для обработки информации [Текст]/С. Оссовский. –
М.: Финансы и статистика, 2004. – 344 с.
3. Круглов, В. В. Нечеткая логика и искусственные нейронные сети.[Текст]/ В. В. Круглов, М. И. Дли, Р. Ю. Голунов. М.: Изд-во
физ.-мат. литературы, 2001. 224 с.
4. Саймон, Нейронные сети: полный курс
[Текст]/ Саймон, Хайкин. – М.: ООО “И.Д.
Вильяме”, 2006. – 1104 с.
Ключевые слова: нейронная сеть, горячая прокатка,
параметры прокатки, сталь, химический состав, прогнозирование механических свойств стали.
Сведения об авторах:
Шкатов Валерий Викторович, доктор технических
наук, профессор, заведующий кафедрой физического
металловедения Липецкого государственного технического университета.
Левин Максим Юрьевич, аспирант кафедры физического металловедения Липецкого государственного
технического университета.
e-mail: shkatov@mail.ru
Адрес: г. Липецк, ул. Московская 30.
Скачать