Research Article

Journal of the Korean Solar Energy Society. 30 December 2020. 151-160
https://doi.org/10.7836/kses.2020.40.6.151

ABSTRACT


MAIN

  • 1. 서 론

  • 2. 전이학습을 위한 예비적 고찰

  •   2.1 건물의 전력 소비량 예측을 위한 기계 학습

  •   2.2 부족한 데이터 예측을 위한 전이 학습

  • 3. 방법론

  •   3.1 대상 건물

  •   3.2 기계 학습 모델 설정

  •   3.3 정확도 검증 지표

  • 4. 데이터 분석 결과

  •   4.1 사전 학습 모델 건물의 예측 결과

  •   4.2 Target 데이터 건물의 예측 결과

  • 5. 결 론

1. 서 론

최근 데이터 분석 기술 발전으로 다양한 분야에서 데이터 분석 및 예측 방안이 증가하고 있다. 그 중 기존 전력망에 정보통신기술이 더해져 전력 생산과 소비 정보를 양방향, 실시간 주고받음으로써 에너지 효율을 높이는 차세대 전력망인 스마트 그리드에 대한 관심이 증가하고 있다1,2,3). 스마트 그리드의 가장 핵심 기술 요소는 건물의 전력 소비량을 파악하여 신재생 시스템의 발전량과 차이를 미리 도출하는 것이다. 최근 가장 활발히 사용되고 있는 예측 방안은 기존 데이터와 처리 경험을 학습하여 주어진 파라미터를 통해 최적화된 결과를 도출하는 기계 학습이다. 건물의 전력 소비량 예측을 위해 과거 데이터를 활용하여 진행하게 되는데 몇몇 신축 건물은 지어진지 오래되지 않아 데이터 수가 부족하며, 기축 건물의 경우 데이터 수집 간격이 길어 데이터 수가 적어지연 예측 정확도 감소로 이어지게 된다.

이를 해결하기 위하여 학습 데이터가 풍부한 분야의 모델을 미리 사전 학습하여 데이터가 부족한 분야에 가중치를 재 사용하는 전이 학습을 활용할 수 있다4,5). 최근 전이 학습으로 건물의 전력 소비량을 예측하는 대부분의 연구는 풍부한 건물의 데이터를 특정한 모델 또는 개발한 모델에 사용하여 높은 정확도를 도출하는 것을 목적으로 하고 있다6). Mocanuu7)는 스마트 그리드에서 건물 전력 사용량을 예측하기 위하여 강화학습과 전이학습을 적용하였고 실제 데이터를 활용하여 검증하였다. Ribeiro8)은 전이 학습인 Heptaestus 방법을 활용하여 cross-building을 대상으로 계절적 요소와 추세 조절을 활용하여 건물의 전력 사용량을 예측하였다. 그러나 실제 기계 학습 활용 시 많은 시간과 노력을 필요로 하는 전처리를 위한 연구는 아직까지 미비한 실정이며 전이학습에서 특히 중요하게 여겨지는 고정된 레이어 수는 정량적 기준 보다는 대부분 정성적인 기술자의 주관적 판단 및 해석으로 진행되고 있는 실정이다.

따라서, 본 연구에서는 전이 학습을 활용하여 데이터가 부족한 건물의 전력 소비량을 예측하여 전이학습의 사용 가능성을 검증하며, 건물 전력 소비량 예측 시 전이 학습의 활발한 활용을 도모하기 위하여 전처리 과정 중 고정된 레이어 수에 따른 정확도를 도출하여 정량적 기준 도출 및 분석을 진행해 보고자 한다.

2. 전이학습을 위한 예비적 고찰

고정된 레이어 수를 조정하여 정확도를 도출하기 위하여 전이 학습에 관한 고찰을 진행하였으며, 각 내용은 다음과 같다.

2.1 건물의 전력 소비량 예측을 위한 기계 학습

기계 학습은 인공 지능의 한 분야로 경험을 통하여 자동으로 학습하는 기술 즉, 최적의 가중치를 찾는 방식을 말한다. 그 중 딥러닝(Deep learning)은 심층 학습이라고도 불리며 ANN (Artificial Neural Network)12)를 기반으로 사람의 신경망 원리와 구조를 모방하여 만든 기계 학습 알고리즘을 말한다.

현재 ANN은 다양한 분야에서 활용되고 있으며 건축 분야 또한 활발히 적용되고 있다10). 뿐만 아니라 ANN에서 발전된 모델인 FFNN (Feed Forward Neural Network), SRWNN (Self-Recurrent Wavelet Neural Network) 등이 개발되어 연구되고 있다13,14).

ANN은 학습 과정에서 gradient에 의해 가중치가 결정되는 방식인데 gradient는 점점 작아지거나 0에 수렴하는 문제점을 가지고 있다. 이는 over-fitting의 발생 가능성이 존재하며 데이터가 적은 경우 해당 학습 데이터에 특화되는 단점을 가지고 있다.

RNN (Recurrent Neural Network)는 반복적이며 순차적 학습의 한계를 해결하였으며, 내부 순환 구조와 과거 학습의 가중치를 현재에 반영하는 특징을 가지고 있는 알고리즘이다. RNN은 초기 데이터 가중치의 값이 초기 값과 멀어지게 되면 상쇄되며 학습 능력이 저하되는 특징을 가지고 있는데, 이를 보완한 알고리즘 모델이 LSTM (Long Short Term Memory)이다.

LSTM11)은 과거의 데이터를 지속적으로 업데이트 하기 때문에 지속적으로 학습 능력을 유지하며, cell state 층에서 가중치의 기억 또는 제거 여부를 결정한다.

2.2 부족한 데이터 예측을 위한 전이 학습

(1) 전이 학습의 정의

전이 학습이란 앞서 언급했듯이, 학습 데이터가 풍부한 분야의 데이터를 사전에 학습하여 학습 데이터가 부족한 분야의 모델 구축을 위해 재사용하는 기계 학습의 한 기법을 말한다. Fig. 1은 일반적으로 사용하는 기계학습 방법을 보여주며 특정 데이터 셋을 훈련시키기 위해서는 많은 양의 특정 데이터 셋이 필요하며 이는 시간적, 비용적으로 쉽지 않다. Fig. 2는 전이학습을 나타내며 큰 데이터 셋에 미리 훈련된 가중치를 데이터가 적은 데이터 셋에 가지고 와 재 보정하여 사용하는 것으로 새로운 데이터를 적용하여도 높은 정확도를 도출할 수 있다는 것을 의미한다.

https://static.apub.kr/journalsite/sites/kses/2020-040-06/N0600400616/images/Figure_KSES_40_06_16_F1.jpg
Fig. 1

Traditional ML

https://static.apub.kr/journalsite/sites/kses/2020-040-06/N0600400616/images/Figure_KSES_40_06_16_F2.jpg
Fig. 2

Transfer learning model

현재 건물 전력 소비량에서도 전이 학습이 적용된 연구가 다양하게 진행되고 있다. 전이 학습은 사전 학습된 모델의 가중치를 내 목적에 맞는 가중치에 추가하는 방식으로 미세 조정(fine-tuning)하여 진행한다. 미세 조정이란 기존 학습되어 있는 모델을 새로운 모델에 변형하고 이미 학습된 모델의 가중치로부터 학습을 업데이트하는 방법을 말한다.

(2) 레이어에 따른 전이 학습 분류 체계

Fig. 3은 사전 학습된 데이터의 학습할 레이어 수를 선정하는 과정을 나타내고 있다. 선정하는과정은 목표로 하는 데이터의 양과 사전 학습된 데이터와의 유사도에 따라 다르게 분류할 수 있다. 아직 고정된 레이어 수의 명확한 기준은 없으며 대부분 데이터가 적으면 고정된 레이어 수를 증가시켜 사전 학습된 모델의 가중치를 최대한 사용하며 이때 오버피팅(over-fitting)의 위험을 주의하기 위해 적절한 레이어 조정을 진행한다. 사전 학습된 데이터와 목표로 하는 데이터의 유사도가 높으면 학습 속도 증가를 위해 고정된 레이어를 감소시키기도 한다.

https://static.apub.kr/journalsite/sites/kses/2020-040-06/N0600400616/images/Figure_KSES_40_06_16_F3.jpg
Fig. 3

Training method

3. 방법론

이상의 자료를 바탕으로 건물의 전력 소비량 예측을 위해 사용된 건물 데이터와 기계 학습 모델 그리고 정확도 검증에 사용된 지표는 다음과 같다.

3.1 대상 건물

(1) 사전 학습 모델 구축을 위한 건물 데이터(Source data)

사전 학습 모델을 위해 사용된 데이터는 진천 지역에 위치한 보육시설로 연면적 1,500 m2의 건물이며 지상1층, 지하1층으로 구성되어 있다. Fig. 4는 2019년 하절기인 5월부터 9월까지 수집된 건물의 시간별 전력 소비량 데이터이다.

https://static.apub.kr/journalsite/sites/kses/2020-040-06/N0600400616/images/Figure_KSES_40_06_16_F4.jpg
Fig. 4

Source data

(2) 예측 목표로 하는 새로운 건물 데이터(Target data)

목표로 하는 건물의 데이터는 동일한 진천 지역의 보건소 건물로 연면적 1,500 m2의 건물이며 지상 1층 지하1층으로 이루어져 있다. Fig. 5는 2020년 하절기인 6월에서 7월까지 수집된 건물의 시간별 전력 소비량이며 사용된 데이터는 5주이며 4주는 학습에 사용되었고 1주는 정확도 검증에 사용되었다. 해당 데이터 분포는 아래와 같다.

https://static.apub.kr/journalsite/sites/kses/2020-040-06/N0600400616/images/Figure_KSES_40_06_16_F5.jpg
Fig. 5

Target data

Fig. 4Fig. 5를 비교하였을 때, 주중에는 건물을 사용하며, 주말에는 사용하지 않는 것으로 비슷한 스케줄을 가지고 있는 건물인 것으로 나타난다. 총 전력 소비량을 비교하면 Source 건물이 Target 데이터에 비해 큰 전력 소비를 하고 있는 것으로 나타난다.

3.2 기계 학습 모델 설정

전이 학습 시 사용된 모델은 GitHub에서 “Transfer Learning on Time Series Prediction” NshanPotikyan의 알고리즘을 사용하였으며, 본 논문에 적용하기 위해 수정 후 사용하였다. 해당 모델은 시계열 데이터를 적용할 수 있는 LSTM 모델에 전이 학습을 적용하였다. 학습을 위해 사용된 언어는 Python 3.8이며, 통계를 위한 Numpy, Pandas를 사용하였고, 학습을 위해 keras, sklearn을 활용하였다.

입력 데이터는 온도(℃), 습도(%), 일사량(W/m2), 실내외 온도차(℃), 시간(hour), 월(month), 일별 스케줄, 주별 스케줄을 적용하여 총 10개의 입력 데이터를 적용하였고, 여기서 스케줄은 선행 연구9)에서 활용된 일별과 주별을 도출할 수 있는 prophet의 모델을 통해 진행하였다. 정확도가 가장 높았던 8, 16, 32, 32, 64개의 뉴런이 적용된 5개의 은닉층을 적용하였으며 출력 데이터는 건물 전력 소비량(kW)으로 나타낸다.

본 연구의 고정된 레이어 수에 따라 정확도 검증을 진행하기 위해 총 8개의 Case로 진행한다. Fig. 6과 같이 왼쪽부터 첫 번째, 모든 레이어를 고정하지 않고 학습하는 방법, 두 번째, 하나의 레이어를 고정하고 학습하는 방법, 세 번째, 두 개의 레이어를 고정하고 학습하는 방법, 네 번째, 세 개의 레이어를 고정하고 학습하는 방법, 다섯 번째, 네 개의 레이어를 고정하고 학습하는 방법, 마지막으로 다섯 개의 모든 레이어를 모두 고정하고 학습하는 방법으로 분류하여 진행한다.

https://static.apub.kr/journalsite/sites/kses/2020-040-06/N0600400616/images/Figure_KSES_40_06_16_F6.jpg
Fig. 6

Cast study

3.3 정확도 검증 지표

진행된 예측의 결과를 검증하기 위해 통계 지표인 CVRMSE (Coefficient of Variation of the Root Mean Square Error)와 MBE (Mean Bias Error)를 활용하였으며, 해당 지표는 식(1), (2)에서 확인할 수 있다.

(1)
CVRMSE[%]=RMSEOavg×100
(2)
MBE[%]=Period(P-O)PeriodO

예측된 결과는 ASHRAE Guideline 14에서 제공하고 있는 기준을 참고하여 CVRMSE 30%이하, MBE ±10% 이하로 적용한다.

4. 데이터 분석 결과

4.1 사전 학습 모델 건물의 예측 결과

사전 학습으로 사용된 데이터를 미리 학습하여 80%는 학습 20%는 검증으로 진행하였다. 그 결과는 Fig. 7과 같이 나타나며 CVRMSE는 30.90%, MBE는 -11.55%로 나타났다.

https://static.apub.kr/journalsite/sites/kses/2020-040-06/N0600400616/images/Figure_KSES_40_06_16_F7.jpg
Fig. 7

Accuracy result of source data prediction

4.2 Target 데이터 건물의 예측 결과

목표로 하는 데이터의 보건소 건물의 4주일은 학습에 활용하였고, 1주일은 검증으로 진행하였다. 앞서 언급했듯이, 고정된 레이어 수에 따라 여섯 개의 Case로 분류하였고 전이학습을 적용하지 않은 Case를 추가하여 총 일곱 개의 Case로 나누어 진행하였는데, 그 결과는 Fig. 8과 같이 나타내었다. 검은색 실선은 실제 측정된 건물 전력 소비량이며, 원형의 실선은 모든 레이어가 재 학습에 사용된 경우, 빨간색 삼각형은 한 개의 레이어가 고정된 경우, 노란색 원형은 두 개의 레이어가 고정된 경우, 수직으로 된 실선이 그어져 있는 형태는 세 개의 레이어가 고정된 경우, 회색 실선은 다섯 개의 레이어가 고정된 경우, 점선 형태는 전이 학습을 적용하지 않은 경우를 나타낸 것이다. Table 1은 각각의 정확도를 표에 나타낸 것이며, 레이어 고정 수가 0개, 1개, 2개, 3개일 때 CVRMSE와 MBE는 기준에 적합한 것으로 나타났다. 고정된 레이어 수가 4개, 5개인 경우 모두 기준에 적합하지 않는 것으로 나타났다. 고정된 레이어가 두 개인 세 번째 Case의 경우 가장 높은 정확도를 나타내었다.

https://static.apub.kr/journalsite/sites/kses/2020-040-06/N0600400616/images/Figure_KSES_40_06_16_F8.jpg
Fig. 8

Accuracy result of target data prediction

Table 1.

Prediction accuracy Result

0 Frozen Layer 1 Frozen Layer 2 Frozen Layer 3 Frozen Layer 4 Frozen Layer 5 Frozen Layer Without Transfer Learning
CVRMSE 22.84 29.81 21.66 23.68 42.87 40.12 45.09
MBE 1.35 -2.12 4.03 -0.31 6.2 4.36 5.96

5. 결 론

데이터가 풍부한 분야를 사전 학습하여 데이터가 부족한 분야에 적용할 수 있는 전이 학습을 활용하여 데이터가 풍부한 건물의 전력 소비량 데이터를 사전 학습하여 데이터가 부족한 건물의 전력 소비량을 예측하였으며, 전 처리 과정에서 시간이 소비될 수 있는 레이어 수를 조정하여 시간 소모를 감소시키면서 정확도를 도출하여 비교 분석하고자 하였다. 본 연구의 결론은 다음과 같다.

(1) 전이 학습을 활용하지 않은 모델의 경우 CVRMSE 45.09%, MBE 5.96%로 정확도 기준에 적합하지 않는 것으로 나타났다.

(2) 다섯 개의 레이어로 전이 학습을 진행하였을 때, 고정된 레이어 수가 0-3개의 경우 예측 정확도 기준에 적합한 것으로 나타났으며, 4개에서 5개의 경우 정확도 기준에 적합하지 않는 것으로 나타났다.

(3) 고정된 레이어 수가 증가할수록 정확도는 감소하는 것으로 나타났으나 정확도가 레이어 수에 비례하여 나타나진 않는다.

(4) 본 연구는 건축 분야에서 활발하지 않은 전이 학습을 적용하여 데이터가 부족한 신축 또는 기축 건물의 에너지 사용량을 예측하는 것에 의의를 가지며 더 나아가 스마트 그리드를 넘어 마이크로 그리드 개발 시 기초 연구로 활용되길 기대한다.

기호설명

O : 실측 값(kW)

Oavg : 실측 평균 값(kW)

P : 예측 값(kW)

Acknowledgements

본 연구는 국토교통부 / 국토교통과학기술진흥원의 지원으로 수행되었음(과제번호 20PIYR-B153277-02).

References

1
Eghbal, M., Saha T. K., and Mahmoudi-Kohan, N., Utilizing Demand Response Programs in Day Ahead Generation Scheduling for Micro-grids with Renewable Source, 2011 IEEE PES Innovative Smart Grid Technologies Asia (ISGT), pp. 1-6, 2011. 10.1109/ISGT-Asia.2011.6167148
2
Sanseverino, E. R., Silvestre, M. L. D., Ippolito, M. G., Paola A. D., and Re, G. L., An Execution, Monitoring and Replaning Approach for Optimal Energy Management in Microgrids, Energy, Vol. 36, pp. 3429-3436, 2011. 10.1016/j.energy.2011.03.047
3
Mohamed, A., Salehi V., and Mohammed, O., Real-time Energy Management Algorithm for Mitigation of Pulse Loads in Hybrid Microgrids, IEEE Trans. Smart Grid, Vol. 3, pp. 1911-1922, 2012. 10.1109/TSG.2012.2200702
4
Farhadi, A., Forsyth D. A., and White, R., Transfer Learning in Sign Language, IEEE Conference on Computer Vision & Pattern Recognition, 2007. 10.1109/CVPR.2007.383346
5
Peters, M., Ruder, S., and Smith, N. A., "To Tune or Not to Tune? Adapting Pretrained Representations to Diverse Tasks," arXiv:1903.05987 [cs], Mar. 2019. 10.18653/v1/W19-4302PMC6351953
6
Grubinger, T., Chasparis G. C., and Natschläger, T., Generalized Online Transfer Learning for Climate Control in Residential Buildings, Energy Build., Vol. 139, pp. 63-71, 2017. 10.1016/j.enbuild.2016.12.074
7
Mocanu, E., Nguyen, P. H., Kling W. L., and Gibescu, M., Unsupervised Energy Prediction in a Smart Grid Context Using Reinforcement Cross-building Transfer Learning, Energy Build., Vol. 116, pp. 646-655, 2016. 10.1016/j.enbuild.2016.01.030
8
Ribeiro, M., Grolinger, K., ElYamany, H. F., Higashino W. A., and Capretz, M. A. M., Transfer Learning with Seasonal and Trend Adjustment for Cross-building Energy Forecasting, Energy Build., Vol. 165, pp. 352-363, 2018. 10.1016/j.enbuild.2018.01.034
9
Ahn, Y., Lee, Y., Oh, E., and Kim, B. S., Building Energy Demand Prediction Model using Fourier Transform Based Schedule Analysis Algorithm, The Society of Air-Conditioning and Refrigerating Engineers of Korea.
10
Jaeger, H., Harnessing Nonlinearity: Predicting Chaotic Systems and Saving Energy in Wireless Communication, Science, Vol. 304, No. 5667, pp. 78-80, 2004. 10.1126/science.109127715064413
11
Hochreiter, S. and Schmidhuber, J., Long Short-term Memory, Neural Comput., Vol. 9, No. 8, pp. 1735-1780, 1997. 10.1162/neco.1997.9.8.17359377276
12
Karatasou, S., Santamouris, M., and Geros, V., Modeling and Predicting Building's Energy Use with Artificial Neural Networks: Methods and Results, Energy Build, Vol. 38, No. 8, pp. 949-958, 2006. 10.1016/j.enbuild.2005.11.005
13
Chitsaz, H., Shaker, H., Zareipour, H., Wood, D., and Amjady, N., Short-term Electric Load Forecasting of Building in Microgrid, Energy and Buildings, Vol. 99, pp. 50-60, 2015. 10.1016/j.enbuild.2015.04.011
14
Chae, Y. T., Artificial Neural Network Model for Forecasting Sub-hourly Electricity Usage in Commercial Buildings, Energy & Buildings, Vol. 111, pp. 184-194, 2011. 10.1016/j.enbuild.2015.11.045
페이지 상단으로 이동하기