'광고/용어' 카테고리의 글 목록

The multi-Armed Bandit Problem이란? #2

광고/용어 2018. 2. 28. 11:41

Multi-armed를 이해하기 위해 one-armed를 알아봅시다. 가장 흔하게 예로 들어지는 one-armed는 슬롯머신입니다. 카지노에서 볼 수 있는 슬롯머신에는우측에 당길 수 있는 긴 레버가 하나 달려 있습니다. (기계식 슬롯머신은 영화나 박물관에서 볼 수 있고 요즈음은 전자식으로 버튼을 누르는 슬롯머신을 쓰고있기는 합니다.) 그 레버를 잡아 당겼다 놓으면 게임이 시작됩니다.

실제로 카지노에서 빠른 시간 안에 많은 돈을 슬롯머신에서 잃을 수 있습니다. 만약에 그 슬롯머신에서 돈을 딸 수 있는 기회가 50:50라고 한다면 실제로 돈을 잃을 기회도 50: 50일 것입니다. 하지만 카지노에서 슬롯머신에 bug를 넣고 사람들은 실제로 50%보다 더 빠른 속도로 돈을 잃게 되며 이 기계가 돈을 강탈해 가기 때문에 이 긴 레버를 bandit(도둑, 강도)라고 부르는 이유가 됩니다.
그러면 multi-armed bandit은 무엇일까요? Multi – armed bandit problem이라는 것은 예를 들면 한 사람이 5대의 슬롯머신 세트를 play해야 하는 상황을들 수 있습니다. 이 5대의 슬롯머신에서 최소한으로 돈을 잃고 최대한으로 돈을따야 합니다. 5대의 슬롯머신을 100번, 1000번 반복되는 게임을 하다 보면 어떤 기계에서 돈을 더 따게 되고 어떤 기계에서 돈을 더 잃을 지 경험적으로 알 수 있습니다. 하지만 가지고 있는 돈은 한정이 되어 있으니 한없이 게임을 반복할 수 는 없습니다.

5대의 슬롯머신을 M1, M2, M3, M4, M5라고 하고 각 각의 기계는 default 값이 달라 돈을 잃고 따는 확률이 다르다고 가정해 봅시다. 하지만 게임을 하는 사람은 사전에 어떤 기계에서 돈을 더 많이 딸 수 있는지는 알 수 없습니다. 따라서 게임을 하는 사람은 빠른 시간 안에 가장 돈을 많이 딸 수 있는 기계를 알아내야 합니다. M1부터 M5까지 슬롯머신마다 각각의 distribution 값을 보게 되면 어떤 기계가 가장 돈을 많이 딸 수 있는 기계인지 알 수 있습니다. 이 사실만 알게 된다면 게임을 하는 사람은 그 기계에만 계속 배팅을 하고 가장 이득이되는 결과를 갖게 될 것입니다.
하지만 어떤 기계가 좋은 결과를 보여주는지 찾는 동안에도 계속해서 돈을 써야 하고 잃어야 합니다. 어떤 기계에서 돈을 딸 수 있는 지 아는 데까지 시간이 많이 걸린다면 확률이 낮은 기계에 돈을 계속 쓰게 되고 그 사이에 가진 돈을 모두 잃게 될 지 모릅니다.

따라서 이렇게 슬롯머신 게임을 하면서 두 가지의 개념이 필요하게 됩니다.
Exploration(탐험하기)과 exploitation(뽑아먹기)
1) 어떤 기계에서 가장 돈을 많이 딸 수 있는지 빠른 시간 안에 알아야 한다(exploration)
2) 동시에 현재 알고 있는 가장 돈을 많이 딸 수 있는 기계에서 최대한 빨리 돈을 계속 따야 한다(exploitation)

또한 여기서 regret이라는 수학적 개념이 나오게 됩니다.
한쪽은 optimal machine에 돈을 계속 넣어서 돈을 따게 되었지만 다른 한쪽은non-optimal machine에 돈을 계속 넣어서 많은 돈을 잃게 되었다면 best outcome과 non-best outcome 사이의 차이가 regret개념이 됩니다.
Optimal machine을 찾기 위해 다른 기계들을 exploration하는데 쓰이는 비용을 opportunity cost라고 하며 다른 non-optimal machine들을 explore하는 시간이 길면 길수록 높은 reget값을 가질 수 있습니다. 빠른 시간 안에 explore하면서 sub-optimal machine을 찾고(exploration) 그 그 기계에서 계속 돈을 따면서( exploitation) 최소한의 시간 안에 optimal machine을 찾아 내야 합니다.
(짧은 시간 안에 찾은 sub-optimal distribution이 정말 optimal distribution인지 검증이 필요합니다. 섣부른 판단으로 sub-optimal을 optimal이라고 판단할 수도 있습니다)

정리를 한다면, The multi-Armed Bandit model의 목적은 best one을 찾고(exploration) 이 best one에서 돈을 따고(exploitation) best one을 찾는 시간을 최소화 하는 것입니다.

[출처] The multi-Armed Bandit Problem이란? #2|작성자 비수술센터소장

저작자표시 비영리 (새창열림)

'광고 > 용어' 카테고리의 다른 글

The Multi- Armed Bandit Problem이란? #1 [출처] The Multi- Armed Bandit Problem이란? (0)	2018.02.28
더치 옥션 (Dutch auction) (0)	2018.02.28
비커리 경매(Vickery Auction) (0)	2018.02.28
CTR (Click-through rate) (0)	2018.02.28

:

The Multi- Armed Bandit Problem이란? #1 [출처] The Multi- Armed Bandit Problem이란?

광고/용어 2018. 2. 28. 11:40

Reinforcement learning은 쉬운 예를 들어본다면 robot dog에게 걷기 연습을 시키는 algorithm입니다. Robot dog에게 우측 앞발을 움직이고 다음에 좌측 뒷발을 움직이고 그 다음으로 좌측 앞발을 움직이게 프로그래밍을 하고 실제적으로 연속적으로 수행하도록 할 수 있습니다. 또 다른방법으로  Reinforcement learning algorithm을 이용하여 robot dog이 걷도록 training시킬 수 있습니다. 기본적으로 robot dog에게 모든 가능한 action tool 들에 대해 알려줍니다. 이렇게도 움직일 수 있고 저렇게도 움직일 수 있다는 정보를 줍니다. 그리고 robot dog의 목표는 앞으로 나아가는 것이라고 알려줍니다. 앞으로 나아가는 매 순간마다 reward를 받고 넘어지는 순간마다 punishment를 받습니다. 당근이나 간식을 주는 것은 아니고 algorithm에서  reward 는 1이고 punishment는 0 입니다. 기본적으로 robot dog은 모든 가능한 random sets의 action을 시도하게 되고 매 순간 1 과 0 의 평가를 받게 됩니다. Machine은 이러한good action들을 기억하게 되고 반복함으로써 실제로 개가 걷는 것처럼 앞으로 걸을 수 있게 됩니다.

Multi-Armed Bandit Problem은 무엇일까요?
기본적인 가정을 두가지 해보도록 하겠습니다.
1)      우리는 세상에 대해 잘 모른다.
2)      세상은 계속 변한다.
Machine learning에서 지도학습이란 잘 모르는 세상에 대해 기존의 지식을 training하고 일반화를 통해 최적화된 모델을 만드는 것이지만 이 모든 일반화된 모델 역시 두 번째 가정 세상은 계속 변한다에 의해 지속적으로 업그레이드 되어야 하는 경우가 발생하게 됩니다.
이때 필요한 중요한 개념은
Exploration(탐험하기) : 최적 안을 결정하기 위해 다른 안들을 계속 평가하는 것
Exploitation( 뽑아먹기): 최적 안이 나왔다면 이곳으로 사용자를 몰아주고 최대의 이익이 나올 수 있도록 하는 것.
반복적으로  검증가능한 현상을 과학이라고 부르지만 비즈니스 환경 등에서는 계속되는 변화 속에 있고 추세의 변화를 빠르게 찾아낼 필요가 있게 됩니다. 얼마만큼의 시간과 재화의 투자를 exploration(탐험하기)에 몰아주고 얼마만큼의 시간과 재화를 exploitation(뽑아먹기)에 몰아주어야 이익이 최대가 될 것인가를 알고 또한 시간의 흐름에 따라 얼마의 비중으로 exploration과 exploitation의 비율을 바꾸어갈지 판단해야 하며 이는 어려운 문제가 됩니다. 이와 같은 딜레마의 대표적인 예가 multi-armed bandit problem입니다.

[출처] The Multi- Armed Bandit Problem이란? #1|작성자 비수술센터소장

저작자표시 비영리 (새창열림)

'광고 > 용어' 카테고리의 다른 글

The multi-Armed Bandit Problem이란? #2 (0)	2018.02.28
더치 옥션 (Dutch auction) (0)	2018.02.28
비커리 경매(Vickery Auction) (0)	2018.02.28
CTR (Click-through rate) (0)	2018.02.28

:

더치 옥션 (Dutch auction)

광고/용어 2018. 2. 28. 10:43

두산백과

더치 옥션

[Dutch auction음성듣기]

요약 매도자가 최고 호가로부터 점차 가격을 낮추어 가다가 매수 희망자가 나오면 최초의 매수 희망자에게 매도하는 경매 가격결정 방법.

네덜란드식 경매라고도 한다. 일반적으로 경매는 최저 호가로부터 점차 가격을 높여 가다가 최고 호가의 매수 희망자, 곧 마지막 매수 희망자에게 매도하는 방식을 취한다. 그러나 더치 옥션은 이와는 반대로 매도자가 최고 호가로부터 점차 가격을 낮추어 가다가 매수 희망자가 나오면 최초의 매수 희망자에게 일괄 매도하는 가격결정 방법이다.

이는 채권을 매각할 경우에도 마찬가지로 적용된다. 즉 경매에 참여한 매수 희망자가 자신이 떠안을 수 있는 물량과 가격 조건을 제출하되, 최저 금리를 제시한 물량부터 차례로 채우다가 마지막 물량을 떠안은 매수 희망자가 제시한 금리로 물량을 떠안는 제도를 말한다. 다시 말해 채권을 입찰에 부치되 경매 참여자가 써 낸 금리 가운데 최고치로 발행액 전액을 매각하는 방식이 더치 옥션이다.

1997년 국제통화기금(IMF) 외환위기 당시 외국 금융기관(채권은행)들은 한국의 단기외채 250억 달러를 중장기로 전환할 경우 적용하는 금리를 이 방식으로 결정하자고 제안하였으나, 한국 정부에서는 당사자 협의방식을 주장해 더치 옥션은 수용되지 않았다.

[네이버 지식백과] 더치 옥션 [Dutch auction] (두산백과)

출처 - http://terms.naver.com/entry.nhn?docId=1222336&cid=40942&categoryId=31721

저작자표시 비영리 (새창열림)

'광고 > 용어' 카테고리의 다른 글

The multi-Armed Bandit Problem이란? #2 (0)	2018.02.28
The Multi- Armed Bandit Problem이란? #1 [출처] The Multi- Armed Bandit Problem이란? (0)	2018.02.28
비커리 경매(Vickery Auction) (0)	2018.02.28
CTR (Click-through rate) (0)	2018.02.28

:

비커리 경매(Vickery Auction)

광고/용어 2018. 2. 28. 10:42

잠재적 구매자는 입찰가를 비밀리에 제출하고, 가장 높은 가격을 제시한 사람이 경매에서 이기지만 자신의 입찰가가 아니라 제출된 가격 중 두번째로 높은 가격을 지불한다.

저작자표시 비영리 (새창열림)

'광고 > 용어' 카테고리의 다른 글

The multi-Armed Bandit Problem이란? #2 (0)	2018.02.28
The Multi- Armed Bandit Problem이란? #1 [출처] The Multi- Armed Bandit Problem이란? (0)	2018.02.28
더치 옥션 (Dutch auction) (0)	2018.02.28
CTR (Click-through rate) (0)	2018.02.28

:

CTR (Click-through rate)

광고/용어 2018. 2. 28. 10:26

ICT 시사상식 2015

클릭률

[Click-through rate]
약어 CTR
온라인 광고의 노출횟수 대비 클릭 수를 의미한다. 배너광고가 노출된 횟수(Impression) 중, 실제 클릭을 통해 배너광고에 연결된 웹페이지(웹사이트)로 이동한 경우의 비율을 일컫는다. 어떤 온라인 광고의 웹페이지 게재 횟수(노출된 횟수, impression)가 100번이고, 그 광고 클릭 횟수가 1번이면 CTR(CTR=(클릭 수/ 노출된 횟수)×100)은 1%라는 얘기가 된다. 온라인 광고 효과를 측정하는 데 있어 CTR은 중요 지표다. 웹사이트의 방문자를 광고주가 원하는 최종 웹페이지까지 이동하도록 클릭을 유도하는 데 성공한 광고라면, 방문자의 호기심을 자극하는 데 성공했다고 볼 수 있기 때문이다.
현재 온라인상 광고 클릭률(CTR)은 대략 0.2%~0.3%로 매우 낮은 편이나, 아직 그 어떤 예측 분석 솔루션도 어느 광고 캠페인이 어떤 개인으로부터 최고의 클릭률을 유도할 수 있는지 식별하지 못한다. 광고 클릭 과정은 변덕스러우며, 대개 광고를 접할 당시 개인의 기분 과 요구사항이 반영되는 경우가 많다. 전반적으로 모바일 기기가 PC보다 더 높은 배너광고 클릭률을 기록했다. 안드로이드 기기의 평균 클릭률은 PC의 두 배로 나타나 전 세계적으로 안드로이드 기기에서 더 많은 매출이 발생했다.
반면, 미국과 유럽에서는 iOS 기기 매출이 안드로이드를 앞서는 것으로 조사되었다. 모바일 기기는 PC 사용량을 보완하여 추가적인 매출을 창출한다. 일례로 일요일에 발생하는 전자상거래 중 아이패드 내 구매율은 16% 더 높은 반면, 데스크톱 내 구매율은 10% 낮아진다고 발표했다. 또한 모바일 기기에서 가장 높은 평균 구매가는 호텔 및 렌터카 예약과 의류구매에서 발생했으며 각각 약 365달러, 209달러, 105달러(한화 약 36만원, 22만 원, 11만 원)로 조사되었다.

출처 - http://terms.naver.com/entry.nhn?docId=3586054&cid=59277&categoryId=59282

저작자표시 비영리 (새창열림)

'광고 > 용어' 카테고리의 다른 글

The multi-Armed Bandit Problem이란? #2 (0)	2018.02.28
The Multi- Armed Bandit Problem이란? #1 [출처] The Multi- Armed Bandit Problem이란? (0)	2018.02.28
더치 옥션 (Dutch auction) (0)	2018.02.28
비커리 경매(Vickery Auction) (0)	2018.02.28

:

랄라라

'광고/용어'에 해당되는 글 5건

The multi-Armed Bandit Problem이란? #2

'광고 > 용어' 카테고리의 다른 글

The Multi- Armed Bandit Problem이란? #1 [출처] The Multi- Armed Bandit Problem이란?

'광고 > 용어' 카테고리의 다른 글

더치 옥션 (Dutch auction)

더치 옥션

'광고 > 용어' 카테고리의 다른 글

비커리 경매(Vickery Auction)

'광고 > 용어' 카테고리의 다른 글

CTR (Click-through rate)

ICT 시사상식 2015

클릭률

'광고 > 용어' 카테고리의 다른 글

티스토리툴바