시험후기

ADsP

📢 제48회 ADsP 기출 복원 이벤트

관리자 26.02.04 조회 4573

안녕하세요 데이터에듀PT입니다.

제48회 ADsP 시험이 얼마 남지 않았습니다.
ADsP 합격을 진심으로 기원하며, 수험생 분들과의 정보 공유를 위해 기출 복원 이벤트를 진행하게 되었습니다! 😊

✅ 이벤트 기간

2026년 2월 7일(토) ~ 2월 8일(일) 오후 12시까지

✅ 이벤트 혜택
-문제 + 보기 4개 모두 복원 시 → 스타벅스 커피 쿠폰 1잔 지급
-문제 + 보기 2개 이상 일부 복원 시 → 네이버페이 1,000원~3,000원 차등 지급

✅ 혜택 지급 일자
2026년 2월 12일(목) 이후

이벤트에 대한 자세한 사항은 데이터에듀PT 공지사항에서 확인해주세요👀

기출 복원 이벤트 참여 방법은 본 게시물에 댓글로 시험 문제와 보기를 최대한 구체적으로 작성해주신 후, 아래 구글폼을 제출해주시면 참여가 완료됩니다!

구글폼으로 이벤트 혜택 제공을 위한 개인정보 수집 동의, 개인 정보를 제출해주셔야 이벤트 참여가 완료되니 댓글 작성 후 꼭❗ 구글폼까지 제출해 주세요

[👉 구글폼 링크]

☑️ 복원 댓글

문제는 완전히 일치하지 않아도 됩니다.
보기는 실제 문제의 보기 순서와 달라도 괜찮습니다.

<실제 문제>
문제) 모집단에서 표본을 선택하는 다양한 방법이 존재한다. 다음 중 실제로 표본을 추출하는 데 사용되는 방법으로 적절하지 않은 것은 무엇인가?

보기 1) 층화추출법
보기 2) 집단추출법
보기 3) 집락추출법
보기 4) 단순무작위추출법

<복원 예시>

문제 + 보기 4개 모두 복원한 경우

문제) 모집단에서 표본 추출하는 방법으로 적절하지 않은 것 고르기

보기 1) 단순무작위추출법
보기 2) 집락추출법
보기 3) 집단추출법
보기 4) 층화추출법

문제 + 보기 2개 이상 일부 복원한 경우

문제) 모집단에서 표본 추출하는 방법으로 적절하지 않은 것 고르기

보기 1) 층화추출법
보기 2) 집락추출법

바이언
28. 두 확률변수 X와 Y의 상관계수가 0.5일때 다음 중 옳은 것은?
1. -X와 Y의 상관계수는 0.5이다
2. X+0.1과 Y의 상관계수는 0.6이다
3. X와 2Y의 상관계수는 1이다
4. X+0.3과 Y+0.2의 상관계수는 0.5이다

26.02.07.
쳇베이커
문제) 분해시계열을 구성하는 요소로 적절하지 않은것은?
1. 추세요인
2. 계절요인
3. 순환요인
4. 규칙요인

26.02.07.
손승혁
47. 다음 중 군집 내 오차 제곱합(SSE)을 최소화 하는 방식으로 군집을 수행하는 방식은?

① 최단 연결법

② 최장 연결법

③ 평균 연결법

④ 와드 연결법

26.02.07.
김은후
문제) 분해 시계열 요소 옳지 않은 것 고르기

보기 1) 추세
보기 2) 계절
보기 3) 순환
보기 4) 규칙

26.02.07.
김보현
46 고객데이터 중 결측값이 10%인 데이터가 있다. 결측값이 포함된 데이터 중 하나를 뽑았을 때 특정 고객 데이터가 삭제될 확률은?
1 10%
2 19%
3 20%
4 27%

26.02.07.
에듀26
데이터 분석 활용 3요소가 아닌 것은
1. 데이터
2. 프로세스
3. 기술
4.인력

26.02.07.
박규민
아마 11번
분석대상을 알고 방법을 모를 경우 활용하는 유형은?
1. 최적화
2. 솔루션
3. 통찰
4. 발견

26.02.07.
김보현
다음 중 a,b의 지지도에 대한 설명으로 옳은 것은?
1 a,b가 같이 포함된 거래수 / 전체 수
2 a가 포함된 수 / 전체 수
3 a,b가 함께 포함된 수 / a가 포함된 수

26.02.07.
정의진
8번 데이터 분석 활용 3요소중 아닌것은?
1.데이터
2프로세스
3.기술
4.인력

26.02.07.
Lala
나이성별 변수만으로 이루어진 고객 데이터에 각 변수에 결측값이 있을 확률이 10%일때, 하나라도 결측값이 포함되면 삭제하는 경우 특정 고객 데이터가 삭제될 확률은?
1.10%
2.19%
3. 20%
4. 27%

26.02.07.
Lala
48 번 정형데이터마이닝 기법 중 반응변수가 없는 데이터를 구조화하는 기법은?
1. 기억안남
2. 오즈비
3. K means 군집분석
4. 기억안남

26.02.07.
임경배
X와 Y의 상관계수는 0.5이다. 다음 중 올바른 설명은?

1. -X와 Y의 상관계수는 0.5이다
2. X+0.1과 Y의 상관계수는 0.6이다
3. X와 2Y의 상관계수는 1이다
4. X+0.2와 Y+0.3의 상관계수는 0.5이다

26.02.07.
전상우
분석 방법은 알고 대상을 모를 때
1. 최적화
2. 솔루션
3. 통찰
4. 발견

26.02.07.
Lala
다음 중 분석 문제(?) 우선 순위 고려 시 적절하지 않은 것은?
1. 기술적용수준
2. 비즈니스 성과
3. 전략적 용이
4. 실행 용이성

26.02.07.
kb
분석 방법은 알고 있으나 분석 대상을 모를 때 분석 기획 도출 방법은?
1. 솔루션
2.최적화
3.통찰
4.발견

26.02.07.
kb
빅데이터 가치 패러다임 변화는?
1.digitalization-agency-connection
2.agency-digitalization-connection
3.Digitalization-connection-agency
4.connection-agency-digitalization

26.02.07.
김보현
(닭 모이에 대한 box-whisker plot 그래프 제시.)
1. (다섯 번째 변수) 모이가 (네번째 변수) 모이보다 중앙값이 높다.
2. (여섯번째 변수) 모이의 최댓값은 400을 넘는다.
(이상값이 400 초과에 있었으므로 맞는 보기)
3. (첫번째 변수) 모이의 분포가 나머지 다섯개 모이보다 가장 적다

(수면제 1,2의 효과에 대한 R 코드) 옳지 않은것은?
1. 수면제 2가 수면제 1보다 효과가 좋다.
2. 수면제 1은 nn% 증가했다
3. 수면제 2는 nn% 증가했다.
4. 수면제의 신뢰 구간은 nn~nn이다.
(2,3,4는 맞는보기)

26.02.07.
민현철
13. 상향식 접근방법으로 옳은것은?
1.지도학습
2.비지도학습
3. (??)학습
4.애자일구축

26.02.07.
김서영
다음중측정도가실제값에얼마나가까운지와반복했을때의일관성을함께고려해모델성능을보다정확히해석하기위해사용되는것은?brbr1.정확도br2.재현율br3.F-valuebr4.특이도

26.02.07.
재경
고객 데이터는 나이, 성별로 이루어진 변수이다. 각 변수는 무작위 10%의 이상치를 가지고 있다. 이상치가 있는 데이터를 삭제할 때 특정 고객의 데이터가 삭제될 확률은?

1. 10%
2. 19%
3. 20%
4. 27%

26.02.07.
정시헌
빅데이터활용 위한 요소
1. 인력
2.프로세스
3.데이터
4.기술

26.02.07.
히히213
상향식 접근법으로 알맞은 것?
1. 지도학습
2. 비지도학습
3. 강화학습
4. 애자일구조

26.02.07.
양준환
데이터 거버넌스에 대해 적절하지 않은 것은?
1. 데이터 표준화
2. 데이터 관리 비용
3. 데이터 저장소 구성
4. 인적자원 교육 및 관리

26.02.07.
정소희
이름과 성별로 구성된 고객 데이터가 있다.
각 고객 데이터에서 이름 항목과 성별 항목은 각각 10%의 확률로 결측값을 가진다고 하자.
이름과 성별의 결측 여부는 서로 독립적이며,
이름 또는 성별 중 하나라도 결측값이 존재하는 고객 데이터는 모두 삭제된다.
이때, 임의로 하나의 고객 데이터를 선택했을 때 해당 데이터가 삭제될 확률은 얼마인가?

1. 10%
2. 19%
3. 20%
4. 27%

26.02.07.
백다미
분석성숙도에대한설명으로가장적절하지않은것은?br1br유사업종,경쟁사와의비교분석을도입한다.br②도입,활용,확산,최적화단계로구분하여평가한다.br③평가도구로CMMICapabilityMaturityModelIntegration를사용한다.br④분석능력및분석결과활용에대한조직의성숙도를의미한다.

26.02.07.
박예진
분석 수준 진단 대상으로 옳지 않은 것은?

분석 성과에 대한 조사
분석 인프라에 대한 조사
분석 인력 및 조직에 대한 조사
분석 업무 수행에 대한 조사

26.02.07.
지현
순서
목적 - 데이터 - 데이터 - 데이터 - 검증
목적 - 데이터 - 데이터 - 데이터 - 검증

추세가 있는 시계열 분석
- 차분
- 제곱근 사용

옳지 않은 것

- 통찰

- 특이도, 민감도, 등등

26.02.07.
김채연
38번

추세가 있는 비정상 시계열을 정상 시계열로 만드는 법
1. 자연로그로 변환
2. 제곱근 이용
3. 제곱 이용
4. 차분

26.02.07.
남민석
교차분석은 2개 이상의 변수를 결합하여 자료의 빈도를 살펴보는 기법이다. 다음 중 교차분석에 대한 설명으로 부적절한 것은 무엇인가?
① 범주의 관찰도수에 비교될 수 있는 기대도수를 계산한다.
② 교차분석은 두 문항 모두 범주형 변수가 아니어도 사용할 수 있으며, 두 변수 간 관계를 보기 위해 실시한다.
③ 교차분석은 교차표를 작성하여 교차빈도를 집계할 뿐 아니라 두 변수들 간의 독립성 검정을 할 수 있다.
④ 기대빈도가 5 미만인 셀의 비율이 20%를 넘으면 카이제곱분포에 근사하지 않으며 이런 경우 표본의 크기를 늘리거나 변수의 수준을 합쳐 셀의 수를 줄이는 방법 등을 사용한다.

26.02.07.
히히213
빅데이터의 위기 요인으로 알맞은 것 모두 고르기

가. 알고리즘 접근 허용
나. 사생활 침해
다. 책임 원칙 훼손
라. 데이터 오용
마. 익명화

26.02.07.
박예진
가치 패러다임 변화로 옳은 것은?

Digitalization->connection->agency
Connection->agency->digitalization
Connection->digitalization->agency
Agency->connection->digitalization

26.02.07.
전승혁
1. 대상X, 방법O? 선지: 최적화, 솔루션, 통찰, 발견

2.상향식? 선지: 비지도, 지도, 강화, 에자일

3. X, Y 상관계수 0.5일 때 옳은 것은?
선지:
-X, Y 상관계수 0.5
X, Y+0.1 계수 0.6
2X, Y 계수 1
X+0.2, Y+0.3 계수 0.5

4. 비정상 시계열 고치는 법은?
선지:
자연로그
제곱근
제곱
차분

26.02.07.
김민성
정형 마이닝 기법에서 반응변수가 없을 경우 분류에 효과적인 기법은
1. 로지스틱
2. 의사결정
3. k-means
4.선형회귀

26.02.07.
디리링
절대0이 있어서 계산 가능한 척도

구간척도
비율척도
명목
순서

26.02.07.
히히213
데이터 준비 단계가 아닌 것?
1. 데이터 탐색
2. 데이터 통합
3. 데이터 정제
4. 데이터 포맷팅

26.02.07.
김상아
빅데이터 주요 분석기법 중 시험공부시간에 따른 성적 변화를 나타내는 분석?
1) 회귀분석
2) 연관규칙
3) 유전자 알고리즘
4) 분류분석/기계학습?

26.02.07.
진무성
시계열 구성요인에 해당하지 않는것
1.계절요인
2. 추세요인
3.순환요인
4.규칙요인

26.02.07.
김민선
다수의 데이터를 척도로 구분할 때 온도, 00등 절대영점이...
1.명목척도
2.서열척도
3.구간척도
4.비율척도

26.02.07.
조윤정
온도, 지수와 같은 척도
1. 명목척도
2. 순서척도
3. 구간척도
4. 비율척도

26.02.07.
조원영
CRISP-DM 데이터준비 단계에 해당되지않는 것
1.데이터탐색
2.데이터정제?
3.데이터통합
4.데이터포맷팅

26.02.07.
얌꿍
정밀도 재현율 트레이드오프 관계라 두 값을 고려한 지표는?
- F1스코어
- 재현율
- 특이도
- 정밀도

26.02.07.
쪼지쪼지
빅데이터 활용 위한 3대 요소가 아닌 것은?
1. 데이터
2. 프로세스
3. 인력
4. 기술

26.02.07.
닝네임
계층적 군집방법 중 편차제곱합을 고려하는 방법은?
1 최단연결법 2 최장연결법 3 평균연결법 4 와드연결법

26.02.07.
김보현
1. 다음 설명 중 옳지 않은 것은?
1. 표출화 : 암묵지를 언어나 문자 등으로 기록
2. 연결화 : 형식지를 편집, 수정
3. 내면화 : 형식지를 보고 지식 습득
4. 공통화 : 다른사람들과의 교류로 암묵지 습득 ?

26.02.07.
디리링
표준화거리 + 상관관계 고려한 거리 측정 방식

표준화거리
민코우스키거리
마할라노비스거리
??

26.02.07.
조윤정
Box plot (A, B, C, D E)그림 다섯개주고 옳지 않은 것 고르기
- A의 중앙값이 가장 높다
- B가 전반적으로 작다
- C에는 400을 넘는 값이 있다
- D의 데이터의 양?? 이 많다

지지도 구하는 수식으로 옳은 것
- a 또는 b의 확률 / 전체확률
- a와 b 동시 확률 / 전체확률
- ?
- ?

옳은 것 고르기
- 향상도가 1보다 크면 예측의 ? 가 높다
- 공분산과 상관관계 부호? 방향? 항상 같다
- 상관관계가 음의 부호이면 반비례 관계이다
-

26.02.07.
지희
1번 암묵지 형식지
공통화 표출화 내면화 연결화

3번
데이터베이스와 dbms 정의 관련문제

4번
데이터베이스 정의
답 많은이들이 접근할수없다?

번호모름
빅데이트 시대의 위기요인 맞는거 고르시오
가 다른거
나 사생활침해
다 책임원칙 훼손
라 데이터오용
마 다른거

번호모름
데이터사이언스 요구역량 틀린것
가 나 다 통찰력 협업능력
라 소프트스킬 - 데이터 분석능력

번호모름
빅데이터 발전 패러다임 변화
책 p.79 쪽 37번 문제

26.02.07.
김대엽
두 가지 변수인 성별,나이로 구성되어 있는 데이터에 무작위로 10%정도의 결측치 발생, 결측치 하나라도 포함되어 있는 데이터는 삭제 하는데 이때 결측 데이터가 삭제될 확률은?
1)10
2)19
3)20
4)27

26.02.07.
하지혜
상관관계를 고려한 측정 방식은?
- 표준화거리
-마할라노비스거리
- 민코우스키거리
- 기억안남

26.02.07.
데이터분석자
빅데이터를 활용 하기 위한 3대 요소가 아닌 것은?
1. 데이터
2. 프로세스
3. 인력
4. 기술

26.02.07.
디리링
추세가 있는 시계열 데이터 정상성 확보에 가장 적합한 방법

차분
로그변환
제곱근변환
??

26.02.07.
엄정현
CRISP DM 데이터 준비 단계에 해당하는 것으로 옳지 않은 것은?

데이터 탐색
데이터 정제
데이터 통합
데이터 포멧팅

26.02.07.
박지완
정형데이터의 데이터마이닝 중 반응함수가 필요하지 않은 기법은?

① 로지스틱 회귀
② 의사결정나무 분류
③ K-평균 군집
④ 선형회귀

26.02.07.
디리링
공분산과 상관계수에 대한 설명중 옳지 않은 것

상관계수의 절대값이 클수록 선형관계가 강한 것이다
공분산과 상관계수의 방향은 항상 같다
상관계수가 음이면 반비례관계라고 할 수있다
공분산은 단위가 달라지면 변한다

26.02.07.
얌꿍
데이터베이스와 DBMS시스템 설명 틀린것
- 데이터베이스는 일정 구조에 맞게 조직화된 데이터 집합이다
- 데이터베이스와 DBMs를 합쳐서데이터베이스시스템이라고한다
-?
-?

26.02.07.
오세빈
분해 시계열 구성 요소 중 가장 적절하지 않은 것은?
- 추세요인
- 계절요인
- 순환요인
- 규칙요인

26.02.07.
이지은
분석 방법은 알고있으나 대상이 명확하지 않은 경우 사용하는 분석 과제 도출 방안은?
1. 최적화
2. 통찰
3. 솔루션
4. 발견

26.02.07.
박지은
정밀도와재현도는어느한값이올라가면어느한값은떨어지는관계가있다.이를보정하기위한지표
1. F1 score
2. 정확도
3. 재현도
4. 특이도

26.02.07.
전치영
46. 고객 데이터 중 결측값이 10%인 데이터 여러 개가 있다. 위 데이터 중 무작위로 하나를 뽑았을 때 데이터를 삭제한다고 하면, 특정 고객 데이터가 삭제될 확률은?

1. 10%
2. 19%
3. 20%
4. 27%

26.02.07.
성민우
정형 데이터마이닝 기법중 반응변수가 없는데도 데이터 구조를 찾는데 적용할 수 있는 기법은?
1. 선형회귀분석
2. 의사결정나무
3. k-means 군집분석
4. 로지스틱회귀분석

26.02.07.
조원영
50. 향상도에 대한 설명으로 가장 적절한 것
보기1.??
보기2. 두 항목이 관련이 없을 경우 향상도는 0이다.
보기3.??
보기4. 향상도가 1에서부터 클수록 규칙은 예측이 정확해진다 .

26.02.07.
김지민
추세가 있는 시계열 데이터 정상성 확보 방법

1. 로그변환을 통해 ~
2.
3.
4. 차분 변환

상관관계를 고려한 측정 방식은?
표준화거리
마할라노비스거리
민코우스키거리
자카드 계수

1번 다음 중 틀린 것은?
표출화 : 암묵지로 만드는 과정 어쩌고
공통화 : 암묵지에서 형식지
연결화 : 형식지에서 암묵지로 ~~
내면화 :
(연결화가 답이였음)

26.02.07.
지희
번호모름
책 233쪽 6번 그림
가 casein의 중앙값이 가장높다
나 sunflower weight는 400이 넘는다?
다 ??
라 horsebean 분포가 평균적으로 낮다

번호모름
온도 지수와 같은 예시의 척도
구간척도

번호모름
추론통계 적절하지않은것
가 모수로 표준평균?
나 가설검정은 검정통계량에서 하나임을 유의
다 ~~유의하지않는다
라 비모수추정은

확률변수 X Y 0.5일때
가 -X Y는 0.5
나 X+0.1 Y2는 0.6이다
다 X +2Y 는 1이다
라 X+0.3 Y+0.2 = 0.5이다

26.02.07.
민재
Crisp-DM 분석 방법론의 데이터 준비 단계에 해당하는 프로세스가 아닌것은?
1)데이터 선택
2)데이터 정제
3)데이터 통합
4)데이터 포맷

26.02.07.
오세빈
49번
A->B 신뢰도 구하기

표.
?, ?, ? 100
?, ?, ? 100
?, ?, ? 50
?, ?, ? 200
…
이런 식으로, 총합은 1000

선지. (퍼센트?, 숫자?)
-20% (0.2)
- 30% (0.3)
- %
- %

답. 300/1000 = 0.3

26.02.07.
조유나
온도, 지수와 같은 대상을 측정하는 방법은?

1. 명목척도
2. 순서척도
3. 구간척도
4. 비율척도

26.02.07.
전조은
다음중인공신경망에사용되는데이터에대한설명으로알맞지않은것은?
1.학습데이터,검증데이터,테스트데이터로분리된다.
2.학습데이터는다른말로?라고도불린다.
3.검증데이터는모델성능평가에활용된다.
4.-

26.02.07.
송수정
인공신경망 레이어층 연결 출력변수에 사용하는 함수?
1) 감마
2) 오즈
3) 활성화 함수
4) CHAID

26.02.07.
안주영
정형 데이터마이닝 기법중 반응변수가 없는데도 데이터 구조를 찾는데 적용할 수 있는 기법은?
1. 선형회귀분석
2. 의사결정나무
3. k-means 군집분석
4. 로지스틱회귀분석

답 3번

• Crisp-DM 분석 방법론의 데이터 준비 단계에 해당하는 프로세스가 아닌것은?
1)데이터 선택
2)데이터 정제
3)데이터 통합
4)데이터 포맷

지지도를 계산하는 방법

전체 거래 수 N 중에서 AB가 함께 나온 거래 수 ÷ N (즉, support(AB)=count(AB)/N).

상관관계를 고려한 측정 방식은?
• 표준화거리
• 마할라노비스거리
• 민코우스키거리
• 자카드 계수
답 3번

28. 두 확률변수 X와 Y의 상관계수가 0.5일때 다음 중 옳은 것은?
-X와 Y의 상관계수는 0.5이다
X+0.1과 Y의 상관계수는 0.6이다
X와 2Y의 상관계수는 1이다
X+0.3과 Y+0.2의 상관계수는 0.5이다

26.02.07.
김태훈
시계열 분해 요소에 해당되지 않는것?
1)추세요인
2)계절요인
3)순환요인
4)규칙요인
정답 : 4번

Crisp - dm 분석방법론의 데이터 준비 단계에 해당하는 프로세스가 아닌것은?
1)데이터 탐색
2)데이터정제
3)데이터 통합
4)데이터 포맷
정답 :1번?

26.02.07.
지희
공분산 상관계수

가
나 공분산과 상관계수 부호는 항상 같다?
다
라

회귀분석
가 모형의 유의미성 - f통계량과 p값이
나 회귀계수들이 유의미 - t통계량과 p값
다 모형의 설명력 - 결정계수
라 모형이 데이터를 적합 - 상관계수?

책 349쪽 19번문제

데이터마이닝 데이터분할
다 검증용데이터는 성능평가에 이용한다
라 데이터양이 충분하지않은경우 교차분석 방법을 통해 데이터를 분할한다

정밀도 민감도 반비례?
F1 스코어

책496쪽 55번

책 540쪽 19번

책550쪽 42번 비슷한문제있었는데
보기가 조금 다름

26.02.07.
수인
36번 시계열 분해 요소 해당되지 않는 것
1. 추세
2 계절
3 순환
4 규칙

26.02.07.
김여진
다음 중 분석 마스커 플랜 수립시 우선적으로 고려해야 하는 사항을 모두 고른 것은?
1. 기술 적용 수준
2.비즈니스 성과
3.실행용이성
4.전략적중요도

26.02.07.
디렌
데이터베이스와 DBMS에 대한 설명으로 옳지 않은 것
1 데이터베이스는 체계적으로 조직화된 데이터 집합이다
2 데이터베이스와 DBMS를 합쳐서 데이터베이스 시스템이라 한다
3 DBMS는 데이터베이스를 구축하는 틀을 제공하여 데이터 검색, 저장 기능을 제공한다
4 데이토베이스는 문자 기호 영상 등 콘텐츠를 체계적으로 수집축적하여 정리한 정보의 집합체이다

상자그림 해석 문제(먹이에 따른 체중)
1 A가 중앙값이 가장 크다
2 B는 이상값을 가진다
3 C가 관측치가 가장 많다
4 D가 전체적으로 체중이 가장 적다

로지스틱 회귀분석 해석 문제
1 y절편이 양수라는 명확한 증거가 없다
(Estimate이 양수, p값이 매우 작게 제시)
2 기울기가 양수라는 명확한 증거가 있다
(Estimate이 양수, p값이 매우 작게 제시)
3 설명력은 약 70%이다
(Multipe R sqaured가 0.70xx)
4 회귀모형은 유의수준 5% 하에서 통계적으로 유의미하다
(p값이 매우 작게 제시)

26.02.07.
정승원
지수,온도처럼 절대적인 0이 아닌 대상을 측정할때 쓰는방법은?
1.명목척도
2.순서척도
3.등간척도
4.비율척도

26.02.07.
전병희

26.02.07.
조민규
정형 데이터 마이닝 기법 중 반응변수가 없는 데이터를 구조화하는 기법은
1.로지스틱회기분석
2 k means 군집분석
3 의사결정 나무
4 선형회귀분석

26.02.07.
이승연
회귀분석 결과 잔차 현황이 아래와 같다. 해결하기 위한 방법을 고르시오.
- 제시이미지:scatterplot, X축:fittedvalue, Y축:residualvalue, fittedvalue 값이 커질수록 잔차분산이 커지는 부채꼴형
1. 특정변수 제거한다.
2. 특정변수 비선형으로 변환한다.
3. AR모형 활용한다.
4. ridge/lasso기법 활용한다.

26.02.07.
유나경
1. 문제

분석 방법은 알고 있지만 대상을 모르는 경우의 분석 방법은?
•솔루션
•통찰
•발견
•최적화
⸻

2. 문제

오분류표 평가 지표 중 재현율과 정밀도는 트레이드오프 관계이다. 이를 보완하기 위한 지표로 알맞은 것은?
•F1 스코어
•특이도
•정확도
⸻

3. 문제

상향식 접근법에 해당하는 것은?
•지도학습
•비지도학습
•애자일 구축
⸻

4. 문제

공분산, 상관계수 관련 내용 중 틀린 것은?
•공분산은 단위가 바뀌면 데이터 값이 변한다
•공분산과 상관계수는 항상 부호가 같다
⸻

5. 문제

시간의 흐름에 ? 따른 학생 성적 변화에 적합한 분석 방법은?
•회귀분석
•연관분석
⸻

6. 문제

시계열에서 추세 제거를 위한 정상화 방법은?
•자연로그 변환
•제곱 변환
•제곱근 변환
•차분
⸻

7. 문제

데이터 분석 마스터플랜 우선순위 고려 요소 중 틀린 것은?
•기술 용이성
•전략적 중요도
•실행 난이도
•비즈니스 성과

---

8. 문제) 회귀분석 잔차 그래프보여주고 해결방법 고르기 (볼록한 모양 위에 점 몰려있던거같음)

-불필요한 변수 지운다
-라쏘 릿지 회귀 방법 사용한다

---

9. 문제) 정성적 데이터, 정량적 데이터 관련 설명 중 맞는 것 고르기 (가~마)

-정량적 데이터는 정성적 데이터에 비해 정제, 가공하기 어렵다?

-정성적 데이터는 형식이 없는 데이터를 포함한다?

-정성적 데이터는 검색하기 용이하다

-데이터는 존재적, 당위적 특성을 갖는다

26.02.07.
김은영
군집내 편차 제곱합응 기반으로 군집 분석을 하는 방법은?

최단연결법
최장연결법
평균연결법
와드연결법

가설검정
귀무가설이 참일때 1종오류의 최대 허용한계는 유의(신뢰)수준이다

회귀모델 해석 및 검정
모형이 통계적으로 유의미한가는 F통계량의 p-value를 통해 알수 있다
회귀계수 유의미함은 t값의 p-value를 통해 알수있다
모형의 설명력은 결정계수를 통해 알수있다
.....

26.02.07.
정가은
학생들의 공부시간에 따른 성적변화를 예측하려고 할 때의 올바른 분석 방법은?
1) 회귀분석
2) 연관규칙
3) 유전자 알고리즘
4) 베이지안? 기계학습?

마스터플랜 수립에서 우선순위 평가 관련 적절하지 않은 것은?
1) 투자 용이성
2) 기술 용이성
3) 전략 필요성
4) 비즈니스 성과

데이터가 다음과 같을 때 A->B Confidence로 옳은 것은?
(표 사진)
1) 25%
2) 35%
3) 30%
4) 20%

데이터베이스에 대한 설명으로 올바르지 않은 것?
1) 데이터베이스는 다양한 데이터가 저장된 정보의 집합체이다
2) DBMS는 데이터베이스를 관이, 운영하는 소프트웨어다
3) 데이터베이스와 DBMS를 데이터베이스시스템이라 부른다
4) 데이터베이스는 문자, 숫자등이 통합된 데이터이다? 자료 그 자체이다?

26.02.07.
정소희
빅데이터 활용에 필요한 3요소가 아닌 것은?
데이터
기술
인력

학생 공부 시간에 따른 성적 예측을 할 때 어떤 분석이 적합한지?
1 회귀분석
2 연관규칙분석
3
4 소셜네트워크분석

오분류표에서 한쪽으로 치우치지 않고 균형잡힌 성능을 측정할 때 사용하는 지표는?
1. F1 score
정확도 | 정밀도 | 민감도 (순서 정확히 모름)

다음의 산전도 그림에서 나타나는 문제를 해결할 수 있는 방법은? (아래가 볼록한 나이키 모양의 형태였음)
1. ( ) 비선형 변환
2.
3.
4. 라쏘, 릿지

26.02.07.
장형준
시계열 요소 아닌 것 고르시오.

1. 추세 요인
2. 계절 요인
3. 순환 요인
4. 규칙 요인

답 : 4번

26.02.07.
김도연
추세가있는비정상시계열정상화하는방법?
1.자연로그변환
2.제곱변환
3.제곱근변환
4.차분

26.02.07.
김도연
연관규칙 A->B 지지도(support) 계산?
1. AB함께/전체
2. AB함께/A
3.
4.

연관규칙 A->B 신뢰도?
1. 25%
2. 30%
3. 40%
4. 50%

26.02.07.
신혜윤
학생 공부 시간에 따른 성적 예측 할때 어떤 분석이 적합한가?
1.회귀분석
2.연관규칙분석
3.유전자알고리즘분석
4.소셜네트워크분석

26.02.07.
김민준
온도와 같이 절대0이 없고 숫자로 나타낼수 있는 척도로 알맞은것은?
1)명목척도
2)순서척도
3)구간척도
4)비율척도

26.02.07.
장석현
다음의 잔차 산점도 그림에서 나타나는 문제를 해결할 수 있는 방법으로 가장 적절한 것은? (나이키 모양의 그래프였고, 오른쪽으로 갈수록 추세에서 벗어난 잔차들 존재했음)

1. 설명변수 x를 비선형으로 전환한다.
2.
3. 잔차에 AR모델을 적용시킨다.
4. 라쏘와 릿지등의 회귀모델을 사용한다.

분해시계열을 구성하는 요소로 가장 적절하지 않은 것은?
1. 추세요인
2. 계절요인
3. 순환요인
4. 규칙요인

암묵지 형식지에 관해 적절하지 않은 것을 고르시오.

1. 공통화: 경험, 대화를 통해 암묵지로 습득된다.
2. 표현화: 학습하여 내재된 암묵지를 문서, 매체로 기록해 형식지로 만든다.
3. 연결화: 암묵지를 토대로 형식지를 편집 및 수정한다.
4. 내면화: 교육과 자료등을 통해 습득하고 체화되어 개인만의 암묵화로 만든다.

정형데이터마이닝 기법 중 반응변수가 없는 데이터를 구조화하는 기법은?

1. 선형 회귀 분석
2. 로지스틱 회귀 분석
3. 의사결정나무
4. K means 군집분석

가설 검정에 대한 설명중 적절하지 않은 것은??

1. 귀무가설은 대립가설에 반대를 가정해서 만든 가설이다.
2. 어떤 가설(추정)의 실패 확률에 근거해 귀무가설의 기각여부를 결정한다.
3. 유의수준이란 1종오류를 범하지 않게 설정한 범위이다.
4 ?

교차분석에 대한 설명으로 알맞지 않은것은??
1. 단순 표를 이용한 대조 뿐만 아니라

26.02.07.
야준
분해시계열을 구성하는 요소로 가장 적절한 것은?

보기1) 추세요인
보기2) 계절요인
보기3) 순환요인
보기4) 규칙요인

숫자로 나타낼 수는 있지만 온도와 같이 절대적 0이 없는 것으로 알맞은 것은?

보기1) 명목척도
보기2) 순서척도
보기3) 구간척도
보기4) 비율척도

연관분석 A->B의 지지도를 계산하는 식으로 알맞은 것은?

보기1) A또는 B를 선택할 경우/전체 경우
보기2) A와 B를 동시에 선택할 경우/전체 경우
보기3) A와 B를 동시에 선택할 확률/A를 선택했을 때 확률
보기4) A와 B를 동시에 선택할 확률/A또는 B를 선택할 확률

분석 방법은 알고 있지만, 분석 대상을 알지 못하는 경우
보기1) 통찰
보기2) 최적화
보기3) 발견
보기4) 솔루션

26.02.07.
옴옴
1번 다음 중 틀린 것은?
1) 표출화: 암묵지를 교재 등으로 표현하는 과정
2) 연결화: 개인의 지식으로 형식지를 보완하는 과정
3) 내면화: 교육 등을 통해 지식을 습득하는 과정
4) 공통화: 대화와 경험을 통해 개인의 암묵지를 발전시키는 과정

2번 가나다라마 다음 중 옳은 답안은? (가나다라마 5개 중에 3개)
(가) 정량적 데이터는 정성적 데이터에 비해 비용이 많이 든다
(나) 기억 안 남
(다) 정성적 데이터는 해석이 용이하다.
(라) 있는 그대로의 객관적 사실을 데이터의 존재적 특성이라고 한다.
(마) 추론 예측 전망 추정을 위한 근거로서의 데이터를 당위적 특성이라고 한다.

답: 나, 라, 마

20번 데이터 거버넌스 관리 체계에 대한 설명으로 옳지 않은 것은?
1) 데이터 표준화
2) 데이터 유지 보수 비용 관리
3) 데이터 관리 체계
4) 지속적인 변화 관리 및 주기적인 교육

26.02.07.
냐옹
분석조직구조에 대한 설명으로 틀린 것은?
보기1) 기능구조는업무 부서 내에서 분석을 수행
보기2) 집중구조는 전략적 중요도에 따라 분석조직이 우선순위를 정해 추진할 수 있다
보기3) 기능구조는 전사적 관점의 핵심 분석은 어려울 수 있다
보기4) 분산구조는 분석 결과를 실무에 신속하게 적용하기 어렵다

26.02.07.
이상민
연관분석 A - > B 일경우, 지지도에해당하는 보기는
1. 전체중A를 구매할확률
2.전체중B를 구매할 확률
3.전체중 A와B를 동시에 구매할확률
4.A를 구매할때 B를 구매할확률

26.02.07.
박준희
빅데이터 활용에 필요한 기본적인 요소로 적절하지 않은 것은?
1.데이터
2.프로세스
3.인력
4.기술

26.02.07.
박준희
계층적 군집분석 중 군집 내 편차들의 제곱합을 활용한 것은?
1.최단연결법
2.최장연결법
3.평균연결법
4.와드연결법

26.02.07.
김유민
상향식 접근법에서 사용하는 방법은?
1) 지도학습
2) 비지도학습
3) 강화학습
4) 애자일구조

분해 시계열 요인으로 다음중 틀린 것은?
1. 추세요인
2. 계절요인
3. 순환요인
4. 규칙요인

26.02.08.
김유민
33. Hitter 데이터는 야구선수들의 기록과 연봉 정보를 포함하고 있다. 다음은 연봉정보를 설명하는 다중 선형회귀분석 결과다. 틀린 것은?
1) 회귀모형은 연봉의 변동을 54% 반영
2) 가장 유의한 설명변수는 Putouts
3) 다른 조건이 고정돼 있을 때, 연봉과
Hits는 양의 상관관계?
4) assists 는 0.5 하에서 유의하지 않음

26.02.08.
송지혜
분석 조직과 인력방안을 수립할 때 다음 중 적절하지 않은 것

1. 집중 구조에서는 프로젝트의 우선순위가 높은 것부터 추진
2. 기능 구조에서는 별도의 전담 조직을 두지 않음
3. 분산 구조에서는 분석 결과를 신속하게 실무에 적용하기 어려움
4. 기능 구조에서는 전사 차원 분석이 어려움

26.02.08.
슬기
나이 성별만으로 이루어진 데이터 중 결측값이 포함된 데이터를 뽑았을 때, 특정 고객의 데이터가 삭제될 확률은?
10%
19%
20%
27%

26.02.08.
이승규
5.학생의 공부 시간에 따른 성적을 예측하기 위해 사용되는 데이터 분석 기법으로 가장 적절한 것은?
1. 회귀분석
2. 연관 규칙 학습
3. 유전자알고리즘
4. 소셜 네트워크 분석

26.02.09.

닉네임으로 등록

실명으로 변경됐습니다.

시험후기

📢 제48회 ADsP 기출 복원 이벤트

댓글

로그인 유도

댓글 삭제

게시글 삭제