Residual Archives (52) 썸네일형 리스트형 가구 내 배우자 찾기(고급 매칭) hid==100인 가구에 52세 여자(3번 관측치)의 남성 배우자 후보는 1번(53세), 2번(32세), 5번(57세)임. hid==200인 가구에 54세 여자(6번 관측치)의 남성 배우자 후보는 7번(64세), 8번(60세), 9번(50세)임. 나이 차이가 가장 적은 남성을 배우자로 식별하고, 동일한 가족 아이디(fid)를 부여하고자 함 즉, hid==100인 가구에서는 3번 관측치와 1번 관측치, hid==200인 가구에서는 6번 관측치와 9번 관측치 1단계: 가구 내 배우자가 있는 남자와 여자의 순번을 정의 // 배우자 있는 여자|남자의 수와 순서 gen byte sp1 = 1 if gtype==92 & gend==1 & wed_sta==2 by hid,sort: gen sp1n=sum(sp1) i.. 코로나19 일일 확진자와 취업자수 추이:2020.1.~2022.6. 자료: 1) 코로나19 일일 확진자(명) 현황: 공공데이터포털(https://www.data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15043378)의 자료 2) 취업자수(만명): 경제활동인구조사(통계청) 월별자료 * 확진자수 그래프를 두 개의 가로축을 활용하는 아이디어는 연합뉴스, “[그래픽]코로나19 사회적 거리두기 변화” , 2022.4.15. 기사(https://www.yna.co.kr/view/GYH20220415000200044)를 참조하였음. 코로나19 확진자와 사회적 거리두기 추이 주: 1) 사회적 거리두기 단계=1,000×단계를 의미함 자료: 1) 코로나19 확진자 현황: 공공데이터포털(https://www.data.go.kr/tcs/dss/selectApiDataDetailView.do?publicDataPk=15043378)의 자료를 직접 가공함(다운로드 일시: 2021.10.29.) 2) 사회적 거리두기 단계: 국회의원자료와 보건복지부 질병청의 보도자료 참고 3) 취업자수: 경제활동인구조사(통계청) 월별자료를 직접 가공 및 작성함. 4) '20년 1차 ~ '21년 2차 등은 코로나19 대응을 위한 정부의 추가경정예산을 의미함 # stata 코드는 나중에 올립니다...지금 너무 바빠서~~ ㅠ x축 라벨 - 두 줄 넣기 * 핵심은 신흥개도국을 두 줄로 작성하는 것... * 초기 자료 lab data "2021.10월, IMF WEO 성장률 전망" sort y2020 // 향후 전망순으로 하고 싶으면 2021년 값으로 정렬.... gen myn = _n lab def clbl 9999 "just" foreach ii of numlist 1(1)16 { // 국가명을 순서에 맞게 라벨링함~~~ loc myc = cname[`ii'] lab def clbl `ii' "`myc'" , add } lab def clbl 14 `" "신흥" "개도국" "' , modify // 여기가 핵심임... lab val myn clbl #delimit ; twoway (bar y2020 myn , barw(0.8) ) (bar y2021 .. 선그래프 특정부분 강조 + 배경색 # 데이터 형태 age -> 연령 yr1963 -> 각 연령별 인구수(만명 단위) # 범례보다 선 옆에 연도 표시하기 위한 좌표 및 라벨 만들기 gen mylab = age lab def alab 42 "1963년" 48 "1990년" 67 "2021년" 83 "2038년" lab val mylab alab # x-축 제목 대신 xlabel로 만들기.. 예) 0세, 1세..... lab def gglab 9999 "just" forvalues ii = 0(1)100 { lab def gglab `ii' "`ii'세", add } lab val age gglab #delimit ; twoway /* 배경 */ (scatteri 0 0 100 0 100 15 0 15, recast(area) color(mi.. OECD 비교: 경활률, 고용률, 실업률 그래프 자동화(?)하기 # 현재 OECD 국가는 38개 국가. # 이들 국가의 각종 연령대별 경활률, 고용률, 실업률 통계: 1950~2020년 # 자료제공 사이트: https://stats.oecd.org/Index.aspx?DataSetCode=lfs_sexage_i_r # 해당 사이트에 가서 다운받을 자료의 레이아웃을 다음과 같이 설정해서, CSV파일로 다운로드 받으면 아래의 코드를 그대로 사용할 수 있음. ^^ # 코드문 import delimited "다운로드받은 폴더\LFS_SEXAGE_I_R_16082021045504964_경활_고용_실업_1950_2020.csv", delimiter(comma) clear // 파일명은 알아서 바꾸고.... # 기초 정리 rename (country v2 v4 age v6 v8 .. Gant chart ? # 특정 기간 비교를 위한 그래프 # 데이터 형태 # 변수설명 icc 국가명(값라벨) ccode 국가명(약어) 문자변수 soc_old07 고령화_도달연도(7%) soc_old14 고령_도달연도(14%) soc_old20 초고령_도달연도(20%) dec_15to64 생산가능인구 감소연도 dec_type 감소유형(생산가능인구) spd_14to20 기간(고령to초고령, 년) spd_old_pab 기간(고령to생산인구감소, 년) # 코드문: 왼쪽 그래프 gsort dec_type soc_old14 gen mycnt = _n ** 순위에 해당하는 국가의 이름으로 라벨링 lab def mylab 1000 "그냥" count forvalues ii = 1(1)`r(N)' { loc mynum = mycnt[`ii'].. graph bar 정렬 문제 #데이터형태 4개연도, OECD 국가들의 각 연령대별 인구비중 prate==1 : 15~64세 인구 (비중) prate==2 : 65세 이상 인구 (비중) prate==3 : 14세 이하 인구 비중 # 각 연도별로 15~64세 인구비중을 기준으로 정렬함으로써, 한국의 상대적 위치를 보고자 하는 것임. # 아무런 조작없이 그리면 국가명으로 정렬되어서 그냥 복잡하기만한 그래프가 됨 # 아이디어: 생산가능인구 비중으로 정렬하여 순위를 매긴후 각 순위에 값라벨을 국가명으로 지정함. # 코드문 gsort year -r_15to64 gen myrank = _n ** 순위에 해당하는 국가의 이름으로 라베링 lab def mylab 1000 "그냥" count forvalues ii = 1(1)`r(N)' { loc .. 이전 1 2 3 4 ··· 7 다음