r2_обоп 0,313 0,087 -0,636 0,023 0,086 0,811 0,577 0,556 0,714 0,708 0,725 0,710. ПЛС2. r2 _обуч -0,24 -0,216 0 РР. r2 _обуч 0,156 0,288 0,368 0,446 0,447 0,905 0,934 0,942 0,959 0,960 0,961 0,962. r2_обоп 0,320 0,100 -0

 УДК 681.51

РАЗРАБОТКА МОДЕЛЕЙ ПОКАЗАТЕЛЕЙ КАЧЕСТВА РЕКТИФИКАЦИОННЫХ КОЛОНН, ФУНКЦИОНИРУЮЩИХ В ПРЕДЕЛЬНЫХ РЕЖИМАХ(

Г.Б. Диго
Институт автоматики и процессов управления ДВО РАН
Россия, 690041, Владивосток, Радио ул., 5
E-mail: 13 LINK mailto:[email protected]) [email protected]

Н.Б. Диго
Институт автоматики и процессов управления ДВО РАН
Россия, 690041, Владивосток, Радио ул., 5
E-mail: [ Cкачайте файл, чтобы посмотреть ссылку ]

И.С. Можаровский
Институт автоматики и процессов управления ДВО РАН
Россия, 690041, Владивосток, Радио ул., 5
E-mail: [ Cкачайте файл, чтобы посмотреть ссылку ]

А.Ю. Торгашов
Институт автоматики и процессов управления ДВО РАН
Россия, 690041, Владивосток, Радио ул., 5
E-mail: [ Cкачайте файл, чтобы посмотреть ссылку ]


Ключевые слова: ректификационная колонна, показатель качества, идентификация, виртуальный анализатор.

Обсуждается один из подходов к построению моделей показателей качества массообменных процессов (в ректификационных колоннах), функционирующих в предельных режимах. Излагается методика определения оптимального количества входных переменных моделей показателей качества (виртуальных анализаторов) на примере промышленной ректификационной колонны, работающей в режиме, близком к состоянию захлебывания.


1. Введение

Одной из важнейших задач в нефтепереработке является задача контроля качества изготавливаемых нефтепродуктов. В настоящее время при оценке качества выходных продуктов нефтеперерабатывающих процессов и, в частности, на ректификационных установках, используются три способа контроля показателей качества: лабораторные анализы, данные поточных анализаторов, данные виртуальных анализаторов (ВА) [1]. Лабораторные анализы достаточно редки и не могут использоваться для управления качеством в реальном времени. Поточные анализаторы постоянно требуют калибровки, чрезвычайно дороги и потому далеко не всегда доступны. В отличие от них виртуальные анализаторы, практически не уступая в точности, значительно дешевле и надежнее. Принцип действия ВА основан на непрерывном определении показателя качества по математической модели, описывающей его взаимосвязь с текущими значениями измеряемых технологических переменных. Они позволяют оценивать не измеряемые непосредственно, но необходимые показатели качества продукта по таким измеряемым параметрам технологического процесса как температура, давление, расход, непрерывно контролируемым современными системами управления.
Для построения ВА обычно используются такие методы как наименьших квадратов (МНК) [2], робастная регрессия (РР) [3], проекции на латентные структуры (ПЛС) [4-5] (случай линейных моделей) и алгоритм АСЕ [6] (нелинейные модели). При этом уделяется недостаточное внимание анализу оптимального количества входов ВА.
В докладе предлагается методика определения оптимального количества входных переменных моделей ВА на примере промышленной ректификационной колонны, работающей в режиме, близком к состоянию захлебывания.


2. Постановка задачи

В реальных условиях качество выходного продукта РК анализируется лабораторным путем, это достаточно сложная, дорогостоящая и, что немаловажно, долговременная процедура. Альтернативой такому подходу является переход к виртуальным анализаторам, использующим промышленные данные (данные со встроенных измерительных датчиков) ректификационной колонны. При разработке ВА также применяются некоторые виды гибридных нейронных технологий, адаптивные алгоритмы автоматического управления для непрерывной настройки модели, регрессионные модели и т.д.
Ставится задача разработки моделей ВА с привлечением различных регрессионных методов (МНК, РР, ПЛС, АСЕ) и методики определения оптимального количества входных переменных при построении ВА ректификационной колонны по содержанию бензолообразующих веществ и концентрации изо-пентана в дистилляте. Следует отметить, что рассматриваемая промышленная РК функционирует в режиме, близком к предельному (захлебывание), поэтому существенно усложняется процесс построения ВА из-за нелинейности физико-химической модели данного режима.


3. Описание промышленной ректификационной колонны

Процесс массообмена в ректификационной колонне показан на рис. 1.



Рис. 1. Схематическое изображение РК.

Средние значения технологических переменных в определенных точках РК, на основе которых будут создаваться ВА, приведены ниже в таблице 1.
Равновесие фаз на каждой ступени разделения РК описывается следующими уравнениями [7]:
(1) 13 EMBED Equation.3 1415
при условиях 13 EMBED Equation.3 1415, 13 EMBED Equation.3 1415,
13 EMBED Equation.DSMT4 1415 – константа физического равновесия на 13 EMBED Equation.DSMT4 1415-ой тарелке 13 EMBED Equation.DSMT4 1415-го компонента (находится по уравнению Антуана [7]),
13 EMBED Equation.DSMT4 1415 – концентрация в жидкой фазе на 13 EMBED Equation.DSMT4 1415-ой тарелке 13 EMBED Equation.DSMT4 1415-го компонента,
13 EMBED Equation.DSMT4 1415 – концентрация в газообразной фазе 13 EMBED Equation.DSMT4 1415-ой тарелке 13 EMBED Equation.DSMT4 1415-го компонента,
C – количество компонентов в смеси.
В исследуемом случае количество компонентов C = 28, (13 EMBED Equation.DSMT4 1415=1, 2,, C), количество тарелок в РК N = 44, (13 EMBED Equation.DSMT4 1415=1,2,, N).

Таблица 1. Технологические переменные РК.

Наименование датчика РК
 
Свк (поток сырья в верху РК) М3/ч
Tв (темп. в вверху РК) град. С
Рв
(давление в верху РК) кг/см3
Спк (поток сырья на входа в РК) М3/ч
Твс (темп. сырья на входе в РК) град. С
Tн (темп. внизу РК) град. С
Рн (давление внизу РК) кг/см3
От (кол-во производ. прод.) Т/ч
Твр (темп. входа прод.) град. С
Спв (скор. выхода продукта) М3/ч
Твых (темп. выхода продукта) C
Твп (темп. верха вых. продукта) C


FIC605
TIC653
PIC643
FIC606
TI649
TIC663
PI644
FIC622
TI666
FI607
TI654
TI667


x1
x2
x3
x4
x5
x6
x7
x8
x9
x10
x11
x12

Знач. датч.
46
88
2
72
85
120
3
30
73
22
194
77


Уравнения материального баланса имеют вид:
(2) 13 EMBED Equation.DSMT4 1415,
где 13 EMBED Equation.DSMT4 1415 – паровой поток, покидающий 13 EMBED Equation.DSMT4 1415-ую тарелку,
13 EMBED Equation.DSMT4 1415 – поток жидкости, покидающий 13 EMBED Equation.DSMT4 1415-ую тарелку,
D – дистиллят (верхний продукт РК),
B – нижний продукт в РК,
N – количество ступеней в РК,
FXi – количество i-го компонента в сырье, поступающем в РК на тарелку13 EMBED Equation.DSMT4 1415,
13 EMBED Equation.DSMT4 1415 – номер тарелки в РК, на которую подается сырье,
XDi – концентрация 13 EMBED Equation.DSMT4 1415-го компонента в дистилляте.
Уравнения энергетического баланса имеют вид:
(3) 13 EMBED Equation.DSMT4 1415,
где 13 EMBED Equation.DSMT4 1415 – энтальпия паров на 13 EMBED Equation.DSMT4 1415-ой тарелке,
13 EMBED Equation.DSMT4 1415– энтальпия жидкости на 13 EMBED Equation.DSMT4 1415-ой тарелке,
13 EMBED Equation.DSMT4 1415 – тепловая нагрузка конденсатора,
13 EMBED Equation.DSMT4 1415 – тепловая нагрузка кипятильника.
Решение системы уравнений (1)-(3) является сложным и трудоемким, что не позволяет проводить вычисления в режиме on-line (сложность и время вычисления увеличиваются в разы с каждым новым компонентом C в исследуемой системе) и использовать ее как рабочую модель ВА.
Создание ВА описывается на примере двух показателей качества: содержание бензолообразующих веществ и концентрация изо-пентана в дистилляте. Для этого имеются необходимые данные лабораторных исследований верхнего продукта (дистиллята) РК и данные датчиков РК в заданное время.


4. Характеристика регрессионных методов, используемых при построении моделей ВА

Проведенные вычислительные эксперименты с промышленными данными РК для построения моделей ВА регрессионными методами показали, что в случае явно выраженной нелинейности алгоритм АСЕ дает более точные результаты, чем регрессионные методы МНК, МЛР, ПЛС, ПЛС2, РР [8]. Модель, получаемая по алгоритму ACE [6, 9], имеет следующую общую форму:
(4) 13 EMBED Equation.DSMT4 1415 ,
где 13 EMBED Equation.DSMT4 1415 - функция выходной переменной 13 EMBED Equation.DSMT4 1415и 13 EMBED Equation.DSMT4 1415 - функции входов 13 EMBED Equation.DSMT4 1415, ( - ошибка, т.е. этот алгоритм позволяет переходить от классического уравнения регрессии, линейного по входным переменным, к уравнению типа (4).
Алгоритм ACE для заданного набора данных, состоящего из выходной переменной 13 EMBED Equation.DSMT4 1415и входных переменных 13 EMBED Equation.DSMT4 1415, начинает свою работу с вычисления некоторых начальных преобразований 13 EMBED Equation.DSMT4 1415. Используя их, вычисляется
(5) 13 EMBED Equation.DSMT4 1415
Минимизация 13 EMBED Equation.DSMT4 1415 из (5) по 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415 достигается посредством минимизации функций, заданных уравнениями:
13 EMBED Equation.DSMT4 1415
13 EMBED Equation.DSMT4 1415.
Процесс минимизации 13 EMBED Equation.DSMT4 1415 осуществляется последовательно по каждой из переменных, для которых вычисляются условные математические ожидания [5].
После минимизации 13 EMBED Equation.DSMT4 1415, и 13 EMBED Equation.DSMT4 1415 получаем оптимальные преобразования 13 EMBED Equation.DSMT4 1415 и 13 EMBED Equation.DSMT4 1415. В результате получаем уравнение:
13 EMBED Equation.DSMT4 1415,
где 13 EMBED Equation.DSMT4 1415- ошибка, не устраняемая использованием алгоритма ACE. Минимум ошибки регрессии 13 EMBED Equation.DSMT4 1415 и максимум коэффициента множественной корреляции 13 EMBED Equation.DSMT4 1415 связаны соотношением 13 EMBED Equation.DSMT4 1415.
Оптимальные преобразования в алгоритме ACE не требуют априорных предположений о какой-либо конкретной функции, связывающей выход и входные переменные. Таким образом, алгоритм ACE оказывается мощным средством для исследования данных и их взаимосвязей.
Алгоритм АСЕ, основанный на нелинейных преобразованиях входных переменных, дает более точную модель при построении ее по данным с явной нелинейной зависимостью. Это относится и к данным РК, так как протекающие в ней процессы являются нелинейными. Следовательно, к данным РК можно применять алгоритм АСЕ, получая более точную, по сравнению с традиционными методами линейной регрессии, модель.


5. Выбор оптимального количества входных переменных при построении моделей виртуальных анализаторов

При построении моделей ВА показателей качества продукта промышленной РК возникает проблема выбора существенных (с точки зрения влияния на выходные показатели) входных переменных. В силу отсутствия теоретического обоснования такого выбора для технологических процессов ректификации приходится проводить вычислительные эксперименты. Для выбора оптимального (в смысле максимального влияния на величину коэффициента детерминации) количества входов предлагается методика, опробованная на доступных промышленных данных (см. таблицу 1), выбранных с учетом физико-химических процессов, влияющих на качество продуктов в РК.
Согласно этой методике имеющиеся исходные данные разбиваются на обучающую и обобщающую выборки размерами 24(12 и 18(12 соответственно.
Для идентификации моделей ВА (содержание бензолообразующих веществ и концентрация изо-пентана в дистилляте) использованы 4 регрессионных метода и алгоритм АСЕ, два набора лабораторных данных (значения (), 12 технологических переменных (значения (). Коэффициенты детерминации, полученные для обучающей и обобщающей выборок, представлены в таблицах 2 и 3.

Таблица 2. Коэффициенты детерминации моделей построенных на разном количестве входов от 1 – 12, сформированных с точки зрения физического смысла для моделей качества промышленной РК по доле бензолообразующих компонентов

 
Количество входов для бензолообразующих

Метод
1
2
3
4
5
6
7
8
9
10
11
12

ПЛС
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
0,156
0,288
0,369
0,446
0,447
0,905
0,935
0,942
0,960
0,960
0,962
0,962

r2_обоп
0,313
0,087
-0,636
0,023
0,086
0,811
0,577
0,556
0,714
0,708
0,725
0,710

МНК
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
0,156
0,288
0,369
0,446
0,447
0,905
0,935
0,942
0,960
0,960
0,962
0,962

r2_обоп
0,313
0,087
-0,636
0,023
0,086
0,811
0,577
0,556
0,714
0,708
0,725
0,710

ПЛС2
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
-0,24
-0,216
0,247
0,402
0,420
0,899
0,929
0,932
0,954
0,954
0,956
0,957

r2_обоп
-0,30
-0,104
0,096
0,367
0,386
0,933
0,754
0,801
0,815
0,812
0,828
0,805

МЛР
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
-0,24
-0,216
0,247
0,402
0,420
0,899
0,929
0,932
0,954
0,954
0,956
0,957

r2_обоп
-0,30
-0,104
0,096
0,367
0,386
0,933
0,754
0,801
0,815
0,812
0,828
0,805

РР
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
0,156
0,288
0,368
0,446
0,447
0,905
0,934
0,942
0,959
0,960
0,961
0,962

r2_обоп
0,320
0,100
-0,698
-0,009
0,077
0,825
0,589
0,566
0,666
0,681
0,709
0,701

АСЕ
 
 
 
 
 
 
 
 
 
 
 
 

R2_24+18
-3,44
0,479
0,709
0,893
0,801
0,944
0,932
0,929
0,927
0,928
0,936
0,971

R2_18
0,512
-0,067
0,762
0,976
0,981
0,974
0,968
0,949
0,949
0,937
0,937
0,925

R2_24
-0,17
-2,702
0,75
0,277
-87,714
0,795
0,974
0,971
0,978
0,964
0,965
0,972



Таблица 3. Коэффициенты детерминации моделей построенных на разном количестве входов от 1 – 12, сформированных с точки зрения физического смысла для моделей качества промышленной
·РК по доли изо-пентана

 
Количество входов для изо-пентана

Метод
1
2
3
4
5
6
7
8
9
10
11
12

ПЛС
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
0,003
0,430
0,446
0,459
0,499
0,886
0,892
0,950
0,952
0,953
0,954
0,955

r2_обоп
-0,369
-1,785
-2,621
-1,909
-3,284
-0,340
-0,903
-4,015
-3,884
-3,666
-3,930
-3,86

МНК
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
0,003
0,430
0,446
0,459
0,499
0,886
0,892
0,950
0,952
0,953
0,954
0,955

r2_обоп
-0,369
-1,785
-2,621
-1,909
-3,284
-0,340
-0,903
-4,015
-3,884
-3,666
-3,930
-3,86

ПЛС2
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
-0,030
0,328
0,422
0,449
0,465
0,875
0,881
0,917
0,921
0,921
0,921
0,926

r2_обоп
-0,159
-1,619
-1,725
-1,384
-1,358
0,643
0,242
-0,910
-1,356
-1,234
-1,204
-2,57

МЛР
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
-0,030
0,328
0,422
0,449
0,465
0,875
0,881
0,917
0,921
0,921
0,921
0,926

r2_обоп
-0,159
-1,619
-1,725
-1,384
-1,358
0,643
0,242
-0,910
-1,356
-1,234
-1,204
-2,57

РР
 
 
 
 
 
 
 
 
 
 
 
 

r2 _обуч
0,001
0,430
0,446
0,458
0,499
0,877
0,891
0,946
0,950
0,953
0,953
0,954

r2_обоп
-0,279
-1,742
-2,501
-1,818
-3,369
0,173
-0,583
-3,016
-3,234
-3,347
-3,683
-3,68

АСЕ
 
 
 
 
 
 
 
 
 
 
 
 

R2_24+18
-4,088
-0,326
0,619
0,745
0,832
0,947
0,894
0,986
0,984
0,987
0,986
0,979

R2_18
0,717
0,850
0,562
0,987
0,988
0,984
0,986
0,968
0,963
0,950
0,950
0,950

R2_24
-1,745
0,572
0,346
-3,414
0,911
0,959
0,953
0,958
0,960
0,962
0,966
0,946


В них под номерами 1-12 во вторых строках подразумевается количество входных переменных, включенных в модель согласно порядку следования в таблице 1.
Из таблиц 2, 3 следует, что для обеих выборок наибольший коэффициент детерминации R2 получен для шести входных переменных, и его максимальное значение достигается при использовании метода ПЛС.
Для нахождения оптимального количества входных переменных также используется матрица парной корреляции между выходом модели ВА и 12 входными переменными (таблицы 4, 5).

Таблица 4. Коэффициенты парной корреляции.

y
1
2
3
4
5
6
7
8
9
10
11
12

Имя входа
TIC653
Ti667
TI666
FIC606
TI654
FIC622
FI607
TI649
PIC643
FIC605
PI644
TIC663

1,000
0,181
0,239
0,015
0,513
0,211
-0,884
0,085
0,197
-0,290
-0,582
-0,835
-0,086

0,181
1,000
-0,558
0,129
-0,134
0,316
-0,121
0,365
0,323
-0,075
0,422
0,012
0,474

0,239
-0,558
1,000
-0,093
0,472
-0,429
-0,085
-0,221
-0,656
0,097
-0,609
-0,223
-0,798

0,015
0,129
-0,093
1,000
0,055
0,023
0,030
0,541
0,050
0,045
0,009
0,010
0,195

0,513
-0,134
0,472
0,055
1,000
0,479
-0,531
-0,300
-0,185
0,254
-0,411
-0,431
-0,611

0,211
0,316
-0,429
0,023
0,479
1,000
-0,317
-0,341
0,307
-0,030
0,193
-0,085
-0,036

-0,884
-0,121
-0,085
0,030
-0,531
-0,317
1,000
-0,092
-0,338
0,235
0,599
0,925
-0,028

0,085
0,365
-0,221
0,541
-0,300
-0,341
-0,092
1,000
0,074
0,184
-0,028
-0,050
0,488

0,197
0,323
-0.656
0,050
-0,185
0,307
-0,338
0,074
1,000
-0,394
0,266
-0,347
0,796

-0,290
-0,075
0,097
0,045
0,254
-0,030
0,235
0,184
-0,394
1,000
0,139
0,394
-0,243

-0,582
0,422
-0,609
0,009
-0,411
0,193
0,599
-0,028
0,266
0,139
1,000
0,662
0,441

-0,835
0,012
-0,223
0,010
-0,431
-0,085
0,925
-0,050
-0,347
0,394
0,662
1,000
-0,031

-0,086
0,474
-0,798
0,195
-0,611
-0,036
-0,028
0,488
0,796
-0,243
0,441
-0,031
1,000



Таблица 5. Входные переменные, упорядоченные по убыванию коэффициентов парной корреляции.

Наименование датчика РК
 
Tв (темп. в вверху РК) град. С
Твп (темп. верха вых. продукта) C
Твр (темп. входа прод.) град. С
Спк (поток сырья на входа в РК) М3/ч
Твых (темп. выхода продукта) C
От (кол-во производ. прод.) Т/ч
Спв (скор. выхода продукта) М3/ч
Твс (темп. сырья на входе в РК) град. С
Рв
(давление в верху РК) кг/см3
Свк (поток сырья в верху РК) М3/ч
Рн (давление внизу РК) кг/см3
Tн (темп. внизу РК) град. С


TIC653
Ti667
TI666
FIC606
TI654
FIC622
FI607
TI649
PIC643
FIC605
PI644
TIC663


x6
x11
x10
x4
x9
x2
x5
x8
x1
x12
x7
x3

Знач. датч.
88
77
73
72
194
30
22
85
2
46
3
120


Использование коэффициентов парной корреляции не всегда позволяет построить модель с высоким значением R2 на обобщающей выборке. Это происходит в связи с тем, что наиболее важные с точки зрения физического смысла входы, такие как давление в колонне и температура верха, имеют малый разброс относительно номинальных значений на обучающей выборке, поэтому выявить наличие статистических связей на уровне коэффициентов парной корреляции практически невозможно, но в то же время небольшие отклонения данных входов от значений, не учтенных в обучающей выборке, негативно влияют на невязку модели ВА.
В таблицах 6, 7 представлены коэффициенты детерминации моделей, построенных на разном количестве входов от 1–12, сформированных с точки зрения возрастания коэффициентов парной корреляции для моделей ВА по доли бензолообразующих компонентов и по доли изо-пентана в верхнем продукте промышленной РК.
Кроме этого, в ходе исследования было перебрано достаточно большое количество комбинаций входов с целью учета физического смысла переменных в моделях ВА.

Таблица 6. Коэффициенты детерминации моделей, построенных на разном количестве входов от 1 – 12, сформированных с точки зрения возрастания коэффициентов парной корреляции для моделей качества промышленной РК по доли бензолообразующих компонентов.

метод
Количество входов для модели по доле бензолообразующих


1
2
3
4
5
6
7
8
9
10
11
12

ПЛС
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
0,6026
0,7694
0,8029
0,8574
0,8616
0,8623
0,8626
0,8628
0,955
0,9557
0,9578
0,9619

R2_обоб
0,6432
0,678
0,8665
0,7781
0,8078
0,8267
0,8389
0,8324
0,8023
0,8308
0,802
0,709

MНK
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
0,6026
0,7694
0,8029
0,8574
0,8616
0,8623
0,8626
0,8628
0,955
0,9557
0,9578
0,9619

R2_обоб
0,6432
0,678
0,8665
0,7781
0,8078
0,8267
0,8389
0,8324
0,8023
0,8308
0,802
0,709

MLR
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
0,252
0,2521
0,298
0,3588
0,6126
0,6195
0,6798
0,7108
0,954
0,954
0,9565
0,9565

R2_обоб
0,1957
0,1909
-0,171
0,2088
0,5845
0,7218
0,6307
0,6796
0,8351
0,8298
0,8043
0,8046

MLR
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
0,252
0,2521
0,298
0,3588
0,6126
0,6195
0,6798
0,7108
0,954
0,954
0,9565
0,9565

R2_обоб
0,1957
0,1909
-0,171
0,2088
0,5845
0,7218
0,6307
0,6796
0,8351
0,8298
0,8043
0,8046

PP
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
0,5981
0,7573
0,8021
0,8571
0,8523
0,8038
0,8607
0,7225
0,9549
0,9556
0,9577
0,9619

R2_обоб
0,6333
0,6712
0,8571
0,7809
0,8252
0,7058
0,8331
0,7893
0,7977
0,8315
0,803
0,7014

ACE
 
 
 
 
 
 
 
 
 
 
 
 

R2_24
0,4015
0,8879
0,901
0,8746
0,8228
0,9085
0,9384
0,8612
0,8219
0,889
0,9655
0,9682

R2_18
0,809
33,638
0,9261
0,9032
0,968
0,9415
0,9388
0,9184
0,9283
0,912
0,9269
0,9325



Таблица 7. Коэффициенты детерминации моделей построенных на разном количестве входов от 1 – 12, сформированных с точки зрения возрастания коэффициентов парной корреляции для моделей качества промышленной РК по доли изо-пентана.

Метод
Количество входов для модели по доле изо-пентана


1
2
3
4
5
6
7
8
9
10
11
12

ПЛС
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
0,7742
0,7792
0,7887
0,7887
0,8062
0,8367
0,8485
0,8682
0,9202
0,9202
0,9213
0,9547

R2_обоб
0,7196
0,7171
0,4574
0,457
0,4274
0,7404
0,4983
-0,3922
-1,8584
-2,017
-1,9979
-3,8533

МНК
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
0,7742
0,7792
0,7887
0,7887
0,8062
0,8367
0,8485
0,8682
0,9202
0,9202
0,9213
0,9547

R2_обоб
0,7196
0,7171
0,4574
0,457
0,4274
0,7404
0,4983
-0,3922
-1,8584
-2,017
-1,9979
-3,8533

МЛР
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
-0,1826
0,1802
0,2799
0,4661
0,5358
0,5491
0,6899
0,7797
0,9197
0,9201
0,9212
0,9263

R2_обоб
-0,556
0,1915
-0,7085
0,3466
0,264
-0,0788
-0,2738
-2,2201
-1,6222
-2,1086
-2,0472
-2,5614

ПЛС 2
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
-0,1826
0,1802
0,2799
0,4661
0,5358
0,5491
0,6899
0,7797
0,9197
0,9201
0,9212
0,9263

R2_обоб
-0,556
0,1915
-0,7085
0,3466
0,264
-0,0788
-0,2738
-2,2201
-1,6222
-2,1086
-2,0472
-2,5614

РР
 
 
 
 
 
 
 
 
 
 
 
 

R2_обуч
0,7742
0,7792
0,7887
0,7886
0,8061
0,8365
0,8484
0,8676
0,8841
0,9103
0,9194
0,9545

R2_обоб
0,7231
0,7204
0,4312
0,4291
0,3906
0,7495
0,505
-0,3803
-0,9917
-1,8124
-2,1996
-3,6761

ACE
 
 
 
 
 
 
 
 
 
 
 
 

R2_24
0,6717
0,4431
-16,115
0,8075
0,6971
0,9304
0,9813
0,9566
0,9727
0,967
0,951
0,969

R2_18
0,7311
0,7863
0,8444
0,8908
0,9261
0,9187
0,9164
0,9129
0,9355
0,9357
0,9464
0,948


Для каждой модели ВА выполнялась проверка на адекватность по критерию Фишера. Результаты проверки статистической значимости параметров уравнений регрессии ВА по критерию Стьюдента приведены в таблице 8.

Таблица 8. Значимость параметров моделей ВА.

Параметр
b0
b1
b2
b3
b4
b5
b6


Для модели ВА изо-пентана (входы выбирались по физич. смыслу)

Значимость
Не знач.
Значим
Значим
Значим
Значим
Значим
Значим

Значения
1,271<1,74
6,612>1,74
3,812>1,74
1,891>1,74
3,005>1,74
2,890>1,74
7,544>1,74


Для модели ВА бензолообразующих компонентов (входы выбирались по физич. смыслу)

Значимость
Не знач.
Значим
Не знач.
Не знач.
Не знач.
Не знач.
Значим

Значения
0,902>1,74
4,710>1,74
0,288<1,74
1,176<1,74
0,213<1,74
0,079<1,74
7,953>1,74


Для модели ВА изо-пентана (входы выбирались по коэфф. парной корреляции)

Значимость
Значим
Значим
Не знач.
Не знач.
Не знач.
Не знач.
Значим

Значения
33,647>1,74
3,847>1,74
1,209<1,74
0,593<1,74
1,248<1,74
1,570<1,74
1,976>1,74


Для модели ВА бензолообразующих (входы выбирались по коэфф. парной корреляции)

Значимость
Значим
Значим
Не знач.
Не знач.
Не знач.
Не знач.
Не знач.

Значения
5,271>1,74
5,316>1,74
1,617<1,74
1,471<1,74
1,724<1,74
0,707<1,74
0,295<1,74

Как показали расчеты, коэффициенты детерминации моделей регрессии при исключении незначимых параметров уменьшались, но лишь незначительно.
В модели ВА по содержанию бензолообразующих компонентов, в случае выбора входных переменных с точки зрения физического смысла, количество значимых входов сокращается до двух. Для модели ВА по доли изо-пентана количество входов (оказывающих влияние на выход с точки зрения физического смысла) уменьшается с 12 до 6, а в моделях, построенных на основе выбора входов по коэффициентам парной корреляции до двух (таблица 9).

Таблица 9. Количество входов в модели и коэффициенты детерминации.

Входы выбирались на основе физического смысла

MНK
Бензолообразующих
Изо-пентан

Кол-во входов
2
6

R2_обуч
0.8663
0.8746

R2_обоб
0.8980
0.6433

 
 
 

Входы выбирались по коэффициентам парной корреляции

MНK
Бензолообразующих
Изо-пентан

Кол-во входов
2
2

R2_обуч
0.7396
0.7927

R2_обоб
0.8164
0.7995


6. Заключение

Предложенная методика определения оптимального количества входных переменных моделей ВА опробована на примере промышленной ректификационной колонны, работающей в режиме, близком к состоянию захлебывания. Проведенные вычислительные эксперименты позволяют утверждать, что при выборе оптимального количества входных переменных целесообразно применять различные методы построения регрессионных моделей ВА, опираясь также на информативность входных переменных с точки зрения физического смысла.


Список литературы

Бахтадзе Н.Н. Виртуальные анализаторы (идентификационный подход) // АиТ. 2004. № 11. С. 3-23.
Lee C., Choi S.W., Lee, I-B. Sensor fault identification based on time-lagged PCA in dynamic processes // Chemometrics and Intelligent Laboratory Systems. 2004. Vol. 70. No. 2. P. 165–178.
Street J. O., R. J. Carroll, Ruppert D. A Note on Computing Robust Regression Estimates via Iteratively Reweighted Least Squares // The American Statistician. 1988. Vol.42. P. 152-154.
Zamprogna E., Barolo M., Seborg D. E. Development of a soft sensor for a bath distillation column using liner and nonlinear PLS regression techniques // Control Engineering Practice. 2004. Vol. 12. No. 7. P. 917-929.
Mejdell T., Skogestad S. Estimation of Distillation Compositions from Multiple Temperature Measurements Using Partial least squares Regression // Ind. Eng. Chem. Res. 1991. Vol. 30. P. 2543-2555.
Breiman L., Friedman J. Estimating optional transformations for multiple regression and correlation // Journal of the American Statistical Association. 1985. Vol. 80. P. 580-598.
Holland C. D. Fundamentals of multicomponent distillation. New York: McGraw-Hill Book Company, 1981. 633P.
Исследование методов идентификации моделей виртуальных анализаторов показателей качества ректификационной колонны / Г.Б. Диго, Н.Б. Диго, И.С. Можаровский, А.Ю. Торгашов // Фундаментальные и прикладные вопросы механики и процессов управления. Всероссийская научная конференция, посвященная 75-летию со дня рождения академика В.П. Мясникова. 11-17 сент. 2011 г., Владивосток: сб. докл. [Электронный ресурс]. – Владивосток: ИАПУ ДВО РАН, 2011. С. 412-418.
Wang D., Murphy M. Estimating optimal transformations for multiple regression using the ACE algorithm // Journal of Data Science. 2004. Vol. 2. P. 329-346.
Вентцель Е.С. Теория вероятностей. М.: Физматгиз, 1962. 560с.


(Работа выполнена при финансовой поддержке гранта РФФИ-ДВО РАН 11-08-98500-р_восток_а «Математическое моделирование предельных режимов функционирования массообменных технологических процессов для задач управления».











 14 "$|
·
·
·ъRoot EntryEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation NativeEquation Native

Приложенные файлы

  • doc 22641685
    Размер файла: 600 kB Загрузок: 0

Добавить комментарий