Research Article

Journal of the Korean Solar Energy Society. 31 December 2019. 113-125
https://doi.org/10.7836/kses.2019.39.6.113

ABSTRACT


MAIN

  • 1. 서 론

  • 2. 연구자료

  •   2.1 발전량 데이터

  •    2.2 천리안 위성 영상 기반 일사량

  • 3. 분석 방법

  •   3.1 회귀 모델

  •   3.2 회귀 모델 선정 방법

  • 4. 결과 및 고찰

  •   4.1 하나의 발전소에서 모델 적합도 순위

  •   4.2 모든 발전소에서 모델 적합도 순위

  •   4.3 모든 발전소데이터를 이용한 회귀분석

  • 5. 결 론

1. 서 론

2018년 12월 소규모 전력 중개 사업을 위한 시행령이 정비되면서 우리나라에서 본격적으로 소규모 전력거래시장이 활성화되기 시작하였다1). 해당 시행령에는 하루 동안의 발전량 예상치를 거래 전일에 사업자가 제출하도록 하여, 그 정확도에 따라 인센티브를 차등 지급하도록 되어 있다. 따라서 사업자들에게 발전량 예보의 정확도는 수익과 직결되는 문제이다. 신재생에너지 발전량은 전통적인 발전에 비해 변동성이 크고 제어가 불가능하기 때문에, 수요와 공급을 항상 맞춰야 하는 계통운영자 입장에서도 발전량 예보가 굉장히 중요하다.

태양광 패널의 용량에 단순히 3.5시간을 적용하여 계산하는 방법 외에, 발전량을 예측하는 방법에는 크게 두 가지가 있으며, 두 방법 모두 예보된 일사량을 입력 자료로 사용한다. 첫 번째는 물리모델을 통한 예측이다. 태양광 패널의 성능곡선, 일사량, 기온, 풍속, 풍향 등의 기상요소와 일사량의 물리적인 관계를 식으로 표현하여 구하는 방법이다. SAM (System Advisor Model), PVSyst, TRNSYS, Energy Plus와 같은 상용프로그램들도 물리모델을 그대로 사용하거나 간소화하여 사용하고 있다. King et al. (1998)2)이 제안한 물리모델이 가장 널리 쓰이고 있다. King et al.의 모델은 태양광 발전량을 구하기 위해서는 해당 패널의 성능곡선, 일사량, 패널의 온도, 그리고 지역에 맞는 6개의 계수가 필요하다.

두 번째는 회귀모델을 사용하는 방법이다. 정규화된 발전량과 일사량간의 회귀분석을 통해 수학식으로 이루어진 회귀모델을 만들어, 이를 통해 발전량으로 환산하는 방법이다. 앞서 살펴 본 물리모델의 경우에도 결국 6개의 매개변수를 실제데이터와의 적합도 분석을 통해 계산해야한다. 반면에, 회귀모델을 사용할 경우 적게는 1개에서 많게는 3개 정도의 매개변수를 사용한다. 입력 자료로서 일사량과 모듈의 온도를 필요로 하기 때문에 발전량 예보를 위해서는 일사량 예보뿐만 아니라 온도 예보까지 필요하다. 또한, 복잡한 물리모델을 활용할수록 보다 많은 인자가 고려된 발전량을 구할 수 있지만, 5분마다 제공되는 일사량을 실시간으로 발전량으로 환산하기에는 무리가 있다. 회귀모델을 사용한 발전량 예측은 각 사이트별 발전량 예측에는 조금 정확도가 떨어질수 있지만, 지역적 또는 전국적인 발전량 예보에는 필수적인 방법이다. 이 때문에 계통운영자나 정책입안자에게는 꼭 필요한 방법이다. 회귀모델을 활용한 발전량 환산은 많은 연구자들에 의해 연구되어 왔으며3), 그 관계가 선형적이라고 알려져 있다4,5,6,7). 본 연구에서는 한국전력거래소의 전력 거래량 데이터와 위성영상을 기반으로 계산된 일사량을 사용하여, 두 변수간의 상관관계가 실제로 선형적인지 알아보려 한다.

2. 연구자료

본 연구에서 일사량과 발전량의 상관관계에 관해 고찰하기 위해, 실측기반의 태양광 에너지 거래량 데이터와 모델기반의 위성영상 일사량 데이터를 사용하였다.

2.1 발전량 데이터

한국전력거래소(KPX)로부터 제공받은 거래량 데이터를 사용하였다. 2012년부터 2016년까지 전국의 1603개 지점의 태양광/풍력 발전소의 1시간 간격의 거래데이터이다. 이 중 발전용량이 확인된 태양광 발전소를 고르면 599개이며, 샘플 추출을 통해 지역별 비율은 유지한 채로 2014년부터 2016년까지 데이터를 무작위로 242지점을 선별하였다. Fig. 1은 선택된 지점들의 공간적 분포를 나타내며, 총 지점수와 선택된 지점 수는 Table 1에 표시하였다. 거래량은 각 발전소에서 1시간동안 한국전력거래소로 보낸 전력량을 나타내며, AMGO (Adjusted Metered Generation Output)으로 표기하고 MWh의 단위를 가지고 있다. 본 연구에서는 거래량을 정규화하기 위해 AMGO를 발전소 용량 CA (Capacity)로 나누어 사용하였다.

http://static.apub.kr/journalsite/sites/kses/2019-039-06/N0600390609/images/Figure_KSES_39_06_09_F1.jpg
Fig. 1.

The position of selected PV plants sites for regression

Table 1 Number of selected sites

Province Total Selected
Jeollanam-do 209 82
Jeollabuk-do 71 28
Gyeongsangnam-do 61 24
Gyeongsangbuk-do 85 34
Chungcheongnam-do 33 13
Chungcheongbuk-do 13 6
Gyeonggi-do 26 11
Gangwon-do 23 9
Jeju-do 34 14
Seoul 5 2
Incheon 8 4
Sejong 1 1
Daejeon 5 2
Daegu 5 2
Gwangju 8 4
Ulsan 1 1
Busan 11 5

2.2 천리안 위성 영상 기반 일사량

한국에너지기술연구원은 Kim et al. (2017)8)이 개발한 UASIBS-KIER (University of Arizona Solar Irradiance Based on Satellite-Korea Institute of Energy Research) 모델에서 생산된 1 km 공간해상도의 일사량을 실시간으로 연산하여 공개하고 있다. 천리안 위성에서 15분 또는 45분마다 제공되는 가시채널 및 적외 채널 위성영상을 활용하여 구름의 존재 유무를 판별한다. 구름이 없는 경우는 청천 일사량을 산정 모듈을 사용하고, 구름이 있는 경우는 구름의 높이를 추정하여 운천 일사량 모듈을 사용하여 전체적인 일사량을 계산한다. 실시간으로 생산되는 자료는 Fig. 2와 같이 신재생에너지 데이터센터 홈페이지에서 실시간으로 공개중이다. 본 연구에서는 전력거래량 데이터에 해당하는 지점에서 시간해상도를 맞추어 산출된 일사량 값 중에서도 수평면 전천 일사량(GHI : Global Horizontal Irradiation)을 사용하였다.

http://static.apub.kr/journalsite/sites/kses/2019-039-06/N0600390609/images/Figure_KSES_39_06_09_F2.jpg
Fig. 2.

Real-time solar irradiation map derived by UASIBS-KIER model in 2019.08.07 13:00 KST

3. 분석 방법

3.1 회귀 모델

앞서 설명한 일사량과 발전량의 상관관계를 파악하기 위해 우선 일사량-발전량의 산점도를 도시하였다. 그 중 대전 코레일 본사 태양광 발전소와 강원 솔라파크의 산점도를 Fig. 3에 나타내었다. 일사량-발전량의 관계는 선형관계로 알려져 있지만 GHI가 500 W/m2보다 클 때 기울기가 줄어드는 모습이 보이며, 그 현상은 강원 솔라파크의 산점도에서 더 두드러지게 나타난다.

http://static.apub.kr/journalsite/sites/kses/2019-039-06/N0600390609/images/Figure_KSES_39_06_09_F3.jpg
Fig. 3.

GHI-AMGO/CA scatter plot of Mirae solar plant (left) and Gangwon solar park plant (right) during 2014-2016

앞의 관찰결과를 토대로 본 연구에서는 일사량-발전량의 관계가 선형보다 S자 형의 회귀모형에 더 가깝다고 보고, 선형 회귀분석을 포함하여 알려진 모든 S자형 모형에 대해 회귀분석을 진행하였다. 회귀분석에 사용된 S자형 모델은 Gompertz model, Logistic model, Weibull model, Richards model, MMF (Morgan-Mercer- Flodin) model, Ratkowsky model이며, 각각의 수식은 Table 2와 같다.

Table 2 Selected models for regression analysis

Name Equation
Linear y=ax+b
Gompertz y=ae-eb-cx
Logistic y=a1+becx
Weibull y=a-b-cxd
Richards y=a(1+eb-cx)1/d
MMF y=ab+cxdb+xd
Ratkowsky y=a1+eb-cx

3.2 회귀 모델 선정 방법

먼저 7개의 모델에 대해 최소자승법을 사용하여 각각의 계수들을 계산하였다. 그리고 계산된 회귀모델들에 대해 아카이케 정보 기준(AIC : Akaike Information Criterion)을 사용하여 모델의 적합도를 평가하였다. AIC는 여러 회귀모델 중에 어떤 모델이 데이터의 상관도를 잘 나타내는지 판단하는 데에 많이 쓰이는 모델이다. AIC 값은 아래와 같은 식(1)을 통해 구한다.

$$AIC=n\log(\widehat\sigma^2)+2k$$ (1)

여기서 k는 모델의 매개변수 개수, n 은 표본의 크기, σ^2은 잔차의 분산으로 잔차 제곱 합을 표본수로 나눈 것이다 (SSR/n). AIC 값은 모델간의 상대적인 적합도를 비교할 수 있게 해주지만, 모델의 절대적인 적합도를 알려주지는 못한다. 본 연구에서 사용한 절차는 다음과 같다. 먼저, 각각의 발전소에 대해 최소자승법을 시행하여 각 모델에 대한 최적 계수를 찾는다. 찾은 계수들을 사용하여 각 모델들에 대한 AIC 값을 찾는다. Fig. 4에 그 순서도를 도식화 하였다. 이 절차를 242개의 발전소에 대해 각각 시행한 후, 순위에 대한 평균을 구해 가장 적합한 모델을 찾았다.

http://static.apub.kr/journalsite/sites/kses/2019-039-06/N0600390609/images/Figure_KSES_39_06_09_F4.jpg
Fig. 4.

Flow chart of the procedure to rank the regression models for a site

4. 결과 및 고찰

4.1 하나의 발전소에서 모델 적합도 순위

Table 3과 Fig. 5는 예시로, 강원 솔라파크 태양광 발전소에 대해 한 결과이다. 가시성을 위하여 모든 모델을 도시하지는 않았다. Table 3에 계산된 AIC값이 나와 있다. 표의 순서대로 위에서부터 가장 AIC값이 작고 아래로 갈수록 크며, Linear 모델의 경우 가장 크게 나왔다. AIC값의 크기를 보았을 때, Gompertz, Richards, Weibull, MMF 모델이 한 그룹을 형성하고, 그 다음은 Logistic, Ratkowsky 모델이, 마지막으로 Linear 모델이 가장 큰 차이로 떨어져 있는 것을 볼 수 있다. Gompertz 모델과 MMF 모델은 AIC 값의 차이는 크지 않으며, 같은 그룹을 형성하고 있다. 그러나 Fig. 5에 도시되어 있는 곡선을 비교해보면 Gompertz 모델(실선) 과 MMF 모델(점선)은 차이가 나는 것을 볼 수 있다. 이렇게 각 발전소마다 1순위부터 7순위까지 모델 적합도에 순위를 부여하고, 최종적으로는 그 통계를 통하여 하나의 모델을 선정하고자 한다.

Table 3 AIC values for Gangwon solar park

Name AIC
Gompertz -48837.52
Richards -48835.39
Weibull -48827.71
MMF -48808.06
Logistic -48654.72
Ratkowsky -48654.72
Linear -47075.28

http://static.apub.kr/journalsite/sites/kses/2019-039-06/N0600390609/images/Figure_KSES_39_06_09_F5.jpg
Fig. 5.

Gompertz, MMF, Linear model for Gangwon solar park

4.2 모든 발전소에서 모델 적합도 순위

4.1의 과정을 모든 발전소에 대하여 수행하고 그 통계를 Table 4에 나타내었다. 그 결과 Linear 모델의 7순위 횟수가 압도적으로 많았으며 평균 순위도 가장 낮았다. 따라서 일사량-발전량의 관계는 선형이 아니라 S자형임을 알 수 있었다. S자형 모델 중에서도 Gompertz 모델의 1순위 회수와 평균 순위가 압도적으로 높았다. 만약 모든 발전소를 아우르는 하나의 일사량-발전량 회귀모델이 있다면, 그것은 Gompertz 모델일 것이다.

Table 4 Selected models for regression analysis

Ranking No. of 1st No. of 2nd No. of 3rd No. of 4th No. of 5th No. of 6th No. of 7th Average
Ranking
Gompertz 164 35 41 1 1 0 0 1.51
MMF 41 89 25 34 6 17 30 3.19
Weibull 24 51 52 105 4 6 0 3.13
Richards 9 59 98 44 0 0 32 3.39
Logistic 2 4 19 39 177 1 0 4.6
Ratkowsky 0 2 3 14 43 180 0 5.64
Linear 2 2 4 5 11 38 180 6.53

4.3 모든 발전소데이터를 이용한 회귀분석

일사량-발전량 회귀분석에서 가장 적합한 모델로 Gompertz 모델이 선정되었다. 4.2에서 각 발전소에 대한 회귀분석을 통해 통계적으로 가장 적합한 모델을 찾았다면, 이 절에서는 모든 발전소 데이터를 사용하여 그 적합한 모델의 계수를 산출하여 보여주고자 한다. 데이터가 존재하는 모든 발전소에 대하여 Gompertz 모델을 사용하여 최소자승법으로 계수를 구한 결과 a=0.761, b= 1.083, c= 0.00411가 나왔으며 Fig. 6에 나타내었다. 전체적으로 데이터의 형태를 잘 반영하고 있는 것으로 보인다. 하지만, GHI=0인 지점에서 발전량이 0이 되지 않는다. GHI=0이라는 것은 태양광이 없다는 뜻이므로, 발전량이 없어야 하지만 Gompertz 모델은 독립변수가 0일 때 종속변수가 0이 되지 않는다. 아래에서 선형모델과 Gompertz 모델을 결합한 새로운 모델을 제시하고자 한다.

http://static.apub.kr/journalsite/sites/kses/2019-039-06/N0600390609/images/Figure_KSES_39_06_09_F6.jpg
Fig. 6.

Gompertz model for all 242 sites (a= 0.761, b= 1.083, c= 0.00411)

결합모델은 기본적으로 Gompertz 모델을 따르되, GHI가 특정 값보다 작은 곳에서는 원점을 지나는 선형모델을 사용하고자 한다. 이 선형 모델의 관계식(2)을 아래와 같이

$$y=d\cdot x$$ (2)

라고 하면, 결합 모델은 다음과 식(3)과 같이 표현된다.

$$\left\{\begin{array}{l}y=d\cdot x\;\;\;\;\;\;\;\;\;\;\;\;\;\;(x\;\leq\;x_{meet})\\y=a\;\cdot e^{-e^{b-c\cdot x}}\;\;\;(x>x_{meet})\end{array}\right.$$ (3)

두 선을 부드럽게 연결하기 위해서는 다음 식(4, 5) 두 가지 조건을 만족해야 한다.

$$y\vert_x=x_meet=d\cdot x_meet=a\cdot e^-e^{b-c\cdot x_meet}$$ (4)

$${\left.\frac{dy}{dx}\right|}_{\;x=x_{meet}}=d=(a\cdot e^{-e^{b-c\cdot x_{meet}}})'\;$$ (5)

여기서 (xmeet, ymeet)은 두 선의 교점이다. 식(5)는 다음과 같이 표현이 가능하다.

$$d=a\cdot c\cdot e^{-e^{b-c\cdot x_{meet}}}\cdot e^{b-c\cdot x_{meet}}$$ (6)

식(6)을 식(4) 대입하면 다음과 같은 등식으로 표현된다.

$$c\cdot x_{meet}\cdot e^{b-c\cdot x_{meet}}=1$$ (7)

식(7)은 Lambert W-function을 이용하여 표현할 수 있으며, 해는 아래와 같다.

$$x_{meet=-}\frac{W(-e^{-b})}c$$ (8)

여기서 W(z)는 Lambert W-function으로, fv=v·ev의 역함수이다. Lambert W-function은 역함수로서, 값이 여러 개 존재한다. 따라서 xmeet또한 여러 개의 해가 존재한다. 여기서는 선형구간을 최소화하기 위해 여러 개의 해 중에서 가장 작은 값을 선택하였다. W(z)의 값은 아래와 식(9)와 같이 적분을 활용한 표현식으로 계산하거나,

$$W(z)=\frac2\pi\int_0^\pi\frac{\sin({\displaystyle\frac t2})(\sin({\displaystyle\frac{3t}2})+e^{\cos(t)}z\sin({\displaystyle\frac52}-\sin t(t)))}{1+e^{2cos(t)}z^2+2e^{\cos(t)}zcos(t-\sin(t))}dt\;\mathrm{for}-\frac1{\mathrm e}<\mathrm z<\mathrm e$$ (9)

다음 식(10)과 같이 무한급수 형태로 계산할 수 있다.

$$W(z)=\sum_{k=1}^\infty\frac{{(-k)}^{-1+k_Zk}}{K!}for\;e\cdot\vert z\vert<1$$ (10)

앞서 구한 전국에 대한 Gompertz모델의 계수인 a=0.761, b= 1.083, c= 0.00411를 사용하여(xmeet, ymeet)을 계산해보면(157.158, 0.1618)이 되고, d= 0.00103이 계산된다. 이를 그래프로 도시하면 Fig. 7과 같다. x0인 곳에서(0, 0)을 향하고 있어, 물리적인 현상을 잘 반영하는 것을 볼 수 있다.

http://static.apub.kr/journalsite/sites/kses/2019-039-06/N0600390609/images/Figure_KSES_39_06_09_F7.jpg
Fig. 7.

Combined model for all 242 sites (a= 0.761, b= 1.083, c= 0.00103) The dotted line represents linear section and the solid line represents Gompertz curve.

새롭게 제시한 모델이 실제 데이터와 어느 정도의 상관관계를 갖는지 알아보기 위해 Linear model, Gompertz model, Combined 모델에 대하여 각각 R2와 RMSE값을 Table 5와 같이 구하였다. Linear 모델에 비해 Gompertz 모델에서 R2와 RMSE, MBE 값의 큰 향상이 있었다. 새로 제시한 Combined 모델의 경우 실제 물리 현상에 더 가깝게 발전량-일사량 상관관계를 표현하면서도 R2와 RMSE 값의 손실이 거의 없었으며, MBE 경우에는 확실히 줄어든 것을 볼 수 있다.

Table 5 Selected models for regression analysis

Model Linear Gompertz Combined
R2 0.809 0.831 0.831
RMSE 0.105 0.099 0.099
MBE 0.0789 0.0735 0.0730

5. 결 론

5분마다 나오는 위성영상 기반 일사량 예보자료를 활용하여 실시간으로 태양광 발전량으로 환산하기 위해, 일사량-발전량의 상관관계를 회구분석을 통해 분석하였다. 3년간의 국내 242개소 태양광 발전소에 대한 한국전력거래소 시간당 전력 거래량 데이터와 위성영상기반 일사량 데이터를 활용하여 일사량-발전량에 대한 최적 회귀모델을 아카이케 정보 기준(AIC) 이용하여 찾았다. 온도의 영향이 없을 때, 태양광 패널의 성능 곡선에서는 일사량과 발전량이 선형 관계에 있지만, 실제 운용중인 발전소에서 일사량-발전량의 관계는 선형 관계가 아닌 것으로 드러났다. 산점도에서 눈으로 확인할 수 있듯이 선형 모델보다 S자형 모델에 더 가까웠고, 실제로 242개소 중 180개소에서 선형 모델의 적합도가 가장 낮은 것으로 확인되었다. 분석에 사용한 6개의 S자 형 모델 중에서도 Gompertz 모델이 164개의 발전소에서 가장 적합한 것으로 나타났다. 하지만, Gompertz모델의 경우 일사량이 없을 때, 발전량을 있는 것으로 나타내는 특징이 있었다. 따라서 본 연구에서는 일사량 특정 값보다 작을 경우 선형 모델을 사용하고, 그 이상일 경우 Gompertz 모델을 사용하는 Combined 모델을 제시하였다. 두 곡선을 부드럽게 이어주기 위해서 경계점에서 함수 값과 함수의 미분 값을 같아지게 하는 경계점과 선형모델의 기울기를 Lambert W-function을 사용하여 표현이 가능했다. 그 결과, 선형 모델의 경우(R2, RMSE, MBE)가(0.809, 0.105, 0.0789), Gompertz 단독 모델의 경우(0.831, 0.099, 0.0735), Combined 모델의 경우(0.831, 0.099, 0.0730)이 나왔다. R2, RMSE, MBE는 모두 Linear 모델보다 Gompertz 모델을 쓸 때, 큰 향상을 보였다. Combined 모델의 경우 Gompertz 모델의 경우와 R2, RSME는 같았지만, MBE가 조금 더 줄어들었으며, GHI=0 근처에서 실제적인 물리현상을 잘 반영했다.

기호설명

a, b, c, d : Coefficients of regression models
AIC : Akaike Information Criterion
AMGO : Adjusted Metered Generation Output (MWh)
CA : Capacity (MW)
GHI : Global Horizontal Irradiation (W/m2)
KIER : Korea Institute of energy Research
RMSE : relative Root Mean Square Error
SS : Sum of Squares
UASIBS : University of Arizona Solar Irradiance Based on Satellite
W(x) : Lambert W-function

하첨자

meet : interception point

Acknowledgements

본 연구는 한국에너지기술연구원 주요사업(B9-2414)으로 수행한 결과입니다. 또한, 본 연구를 위해 국내 태양광 발전소 거래량 데이터를 제공해준 한국전력거래소(KPX)에 감사드립니다.

References

1
1.Cho, S. G., Small Scale Power Brokerage Business Starts from 13th, Korea Energy, Dec 18, http://www.koenergy.co.kr/news/articleView.html?idxno=103987, 2018.
2
2.King, D. L., Kratochvil, J. A., Boyson, W. E., and Bower, W. I., Field Experience with a New Performance Characterization Procedure for Photovoltaic Arrays. In: Proceedings of the 2nd World Conference and Exhibition on Photovoltaic Solar Energy Conversion, Vienna, pp. 1947-1952, 1997.
3
3.Lorenz, E., Hurka, J., Heinemann, D., and Beyer, H. G., Irradiance Forecasting for the Power Prediction of Grid-Connected Photovoltaic Systems, Institute of Electrical and Electronic Engineers Journal of Selected Topics in Applied Earth Observations and Remote Sensing, Vol. 2, No. 1, pp. 2-10, 2009.
10.1109/JSTARS.2009.2020300
4
4.Duffie, J. A. and Beckman, W. A., Solar Engineering of Thermal Processes, John Wiley & Sons, Inc., edition 3, pp. 204-237, 2016.
5
5.King, D., Boyson, W., and Kratochvil, J., Analysis of Factors Influencing the Annual Energy Production of Photovoltaic Systems, 29th IEEE PV Specialists Conference, May 19-24, New Orleans, Louisiana (United States), p. 1357, 2002.
6
6.Huld, T. and Amillo, A. M. G., Estimating PV Module Performance over Large Geographical Regions: The Role of Irradiance, Air Temperature, Wind Speed and Solar Spectrum. Energies 8, pp. 5159-5181, 2015.
10.3390/en8065159
7
7.Sharma, N., Gummeson, J., Irwin D. and Shenoy, P., Cloudy Computing: Leveraging Weather Forecasts in Energy Harvesting Sensor Systems, IEEE SECON 2020, June 21-25, Boston, Massachusetts (United States), pp. 1-9, 2010.
8
8.Kim, C. K., Kim, H.-G.,Kang, Y.-H., and Yun, C.-Y., Toward Improved Solar Irradiance Forecasts: Comparison of the Global Horizontal Irradiances Derived from the COMS Satellite Imagery Over the Korean Peninsula, Pure Appl.Geophys, Vol. 174, pp. 2773-2792, 2017.
10.1007/s00024-017-1578-y
페이지 상단으로 이동하기