분류 전체보기 (150) 썸네일형 리스트형 Attention 논문 정리: Neural Machine Translation by Jointly Learning to Align and Translate encoder decoder seq2seq attention (1) encoder encoder에서는 biRNN 과정을 거친다. 순방향 RNN에서는 input sequence를 앞에서부터 순서대로 읽어서 forward hidden state를 구하고, 역방향 RNN에서는 input sequence를 뒤에서부터 읽어서 backward hidden state를 계산하고 동일한 시점에 대해 forward hidden state와 backward hidden state를 concatenate 한다. j 시점에서 encoder의 hidden state인 hj는 j시점 앞, 뒤의 단어들을 모두 포함하게 된다. RNN은 최근의 단어들에 대해 더 초점을 맞추는 경향이 있기 때문에 hj는 xj 근처의 단어들을 더 많이 .. Attention 모델이란? (배경) seq2seq 모델의 한계점 context vector의 크기가 정해져 있어서 input으로 들어온 모든 정보를 제한된 크기의 vector에 넣어야 하므로 긴 sequence가 input으로 들어왔을 때 학습이 제대로 되지 않는다는 문제가 있었다. 이를 개선한 attention 모델은 단어들의 대응 관계를 파악하는 계산 과정이 추가되어 필요한 정보에 더 잘 주목할 수 있게 된다. Attention model : seq2seq model에서 encoder과 decoder을 개선하여 위의 seq2seq의 문제점을 해결했다. (1) Encoder 개선 기존의 seq2seq 모델은 encoder을 거친 후 나온 context vector의 크기가 정해져 있다는 문제점이 있었는데, encoder의 출력을.. 태블로 기초: 차원과 측정값 vizlab.tistory.com/33 [1]-1. 차원과 측정값 지금이 2018년 8월이니까, 태블로를 사용한지 2년 반 정도 되어갑니다 교육도 받고, 혼자 고민도 하고, 구글링도 하고... 그렇게 저렇게 하면서 지금까지 왔고, 누군가에게 내가 익혔던 것들을 - 작 vizlab.tistory.com 위의 블로그를 참고하여 작성했습니다. SKT bigdata hub에서 데이터를 사용하고 싶었지만, 로그인 허가가 되지 않고 이젠 사이트도 안들어가져서 직접 데이터를 볼 순 없었고 블로그 내용을 캡쳐하여 사용했다. 측정값 아래는 SKT bigdata hub에서 배달 업종 이용 현황에 관한 데이터이고 이를 이용하겠다. 측정값은 우리의 관심을 받는 대상 그 자체이다. 이 데이터셋에서 측정값은 '통화 건수'이다. .. 태블로에서 차트 그리기 ④ 하이라이트 테이블(히트맵)과 기타 차트 하이라이트 테이블(히트맵) * 데이터 준비 고객별 수익을 확인하기 위해 고객 이름과 수익을 ctrl 키를 눌러 동시에 선택하고 표현 방식에서 하이라이트 테이블을 선택했다. 매출, 수량, 할인율을 테이블에서 맵 위로 올려놓아서 고객별 네 변수의 관계를 알아본다. 아직 마크>라벨링이 수익으로만 돼있어서 네 변수 위의 값이 수익에 대한 값으로 모두 동일하다. * 라벨링 모든 측정값에 대해 라벨링을 채우기 위해 마크 안의 측정값을 ctrl로 눌러서 레이블로 올려놓는다. 네 측정값의 범위가 모두 다른데 아직은 네 측정값에 대해 같은 색깔 지표를 사용한다. * 각 측정값에 대해 색 표현 하기 네 측정값에 서로 다른 색깔 지표를 사용하겠다. 마크>측정값 색상 필드 우클릭> 별도의 범례 사용 각 측정값이 모두 다른 색.. 태블로에서 차트 그리기 ③ 스캐터 플랏, 히스토그램, 박스 플랏: 상관 관계와 분포를 나타내는 차트 스캐터 플랏 * 데이터 준비 수익과 할인율의 관계를 알아보기 위해 수익과 할인율을 각각 더블클릭했다. 자동으로 수익은 합계로, 할인율은 평균으로 올라갔다. 측정값 필드 우클릭>기본속성>집계에서 or 열선반/행선반에서 알약 우클릭>측정값에서 확인할 수 있다. 시트의 그래프의 점은 모든 물품에 대한 할인율 평균과 수익 합계를 나타낸다. 고객별로 수익과 할인율의 관계를 파악하고자 '고객 이름'을 마크 안으로 넣어서 스캐터 플랏을 만들었다. 마크의 자동을 원으로 바꾸었다. 점은 한명 한명의 고객이 회사의 할인율과 수익에 어떤 관련이 있는 지에 대한 것이다. (1) 점의 색상/불투명도/테두리 변경 마크>색상>에서 색상/불투명도/테두리를 변경한다. (2) 변수 추가하기 어떤 고객이 수익에 어떤 영향을 끼치는지 파악.. Seq2Seq (Sequence-to-Sequence) 이란? Seq2Seq 모델은 입력 sequence에서 다른 도메인의 sequence를 출력하는 모델로, 챗봇(Chat-bot),기계 번역(machine translation), 내용 요약(text summarization), STT(speech to text) 등에서 주로 쓰인다. Seq2Seq 모델은 encoder와 decoder로 나뉜다. encoder와 decoder는 RNN 구조이고, 그림에서는 둘 다 LSTM을 사용했다. encoder context vector decoder 입력 문장의 모든 단어를 입력받아 context vector를 만든다. encoder RNN 셀의 마지막 시점의 은닉 상태가 context vector이다. 입력 문장에 대한 정보가 압축되어 있다. context vector을 받.. 태블로에서 차트 그리기 ② 비율을 나타내는 차트: 파이차트 & 비율 바차트 파이차트 (0) 데이터 준비하기 매출 금액(sales)이 카테고리(대분류, category)에 어떻게 분포되어 있는지를 파이차트로 확인하기 위해 ctrl 키를 누른 상태에서 '매출', '대분류'를 선택하여 동시에 선택한 후 표현 방식에서 파이차트를 선택한다. or 매출을 행선반에 올려놓고 마크>파이차트 선택 후 대분류를 마크>색상에 올려놓고, 행선반의 매출을 마크>각도에 올려놓는다. (1) 라벨링 하기 왼쪽 측정값의 매출을 마크>레이블에 올려놓는다. (2) 구성 비율로 라벨링 하기 값이 아닌 퍼센트로 나타내기 위해 마크 안에 올려놓은 매출의 레이블 우클릭>퀵테이블 계산>구성 비율을 누른다. (3) 지역 열 추가하기 지역에 따른 카테고리별 매출 금액을 보기 위해 '지역'을 열 선반에 올려놓았다. (4) 각.. 태블로에서 차트 그리기 ① 바 차트와 라인 차트 바 차트 지역에 따른 매출(합계)을 보고자 열 선반에 매출(sales)을, 행 선반에 지역(region)을 올려놓았다. 표현 방식을 설정하지 않았지만, 가장 좋은 방법이 '바차트'라고 태블로가 판단하여 자동으로 바차트가 그려졌다. '마크'에서 데이터 표현 방식을 선택할 수 있다. (1) 불필요한 필드 레이블 숨기기 레이블 우클릭>열에 대한 필드 레이블 숨기기 (2) 축 머리글 표시 해제 후 레이블 직접 붙이기 축 우클릭> 머리글 표시 해제>레이블 버튼 클릭하여 레이블 붙이기 (3) 불필요한 참조선 없애기 참조선 우클릭> 서식> (왼쪽) 라인 서식>행>격자선 '없음' +) 라인 서식> 시트> 축 눈금자 '없음' > 왼쪽의 희미한 세로선 사라짐 (4) 0이 되는 기준선 표시 바차트 그릴 땐 0이 되는 기준 .. 이전 1 ··· 11 12 13 14 15 16 17 ··· 19 다음