안녕하십니까 데이터에듀 윤종식입니다.
2025년 ADsP 세번째 시험인 46회 기출문제 복원한 내용을 게시합니다.
46회 시험은 전반적으로 이전과 비슷한 수준이었으나, 처음 보는 경향의 문제와 ADP 시험에서 나올 법한 문제가 몇 개 출제되고 어려웠다는 의견이 있었습니다. 다만, 30문제 중 20문제 이상은 45회 시험과 비슷한 난이도의 문제들로 예상문제와 모의고사 그리고 기출문제를 중심으로 공부했다면 충분이 맞출 수 있는 수준의 문제들이 출제되어 합격하는데는 문제가 없는 수준이었던 것으로 평가됩니다.
자세한 내용은 데이터에듀PT에서 확인하실 수 있습니다.
21. 결측값에 대한 설명으로 올바른 것은 무엇인가?
>결측값을 대체하는 목적은 과도하게 데이터 정보가 삭제하는 것을을 방지하기 위함이다.
22. 가설 검정에 대한 설명으로 가장 적절하지 않은 것은 무엇인가?
>P-value가 유의수준 0.05보다 작으면 대립가설을 기각한다.
23. 통계적 추론으로 적절하지 않은 것은?
> 30대 남성 체중 기대값을 E(X)로 할 때 모수로 판단할 수 있다.
24. 기다음 확률분포표에서 확률변수 X의 기댓값을 구하시오.
>2.0
25. 다음 회귀 분석 결과에서 결정계수(R2)를 구하시오.
SSR = 30 , SSE = 20
>0.6
26. 일표본 T 검정을 진행한 결과로 적절하지 않은 것은?
>Alpha값이 0.05로 낮아 유의수준 0.05에서 귀무가설이 기각되지 않는다.
27. 중앙 50% 데이터가 흩어진 정도를 나타내는 것은?
>사분위수 범위
28. MDS를 수행한 것으로 옳은 것은?
>영화를 본 사람들을 대상으로 취향을 분석한다.
29. 독립변수 A와B의 피어슨 상관계수가 0.8이다. p-값이 0.01일 때, 유의수준 0.05 하에서 상관계수에 관한 검정에 대한 설명으로 옳은 것은?
>A와 B는 양의 선형 관계이고, 통계적으로 유의하다
30. 아래의 표에서 X,Y의 표본 공분산(Sample Covariance)은 얼마인가?
>3.5
31. 다음 중 주성분분석(PCA)에 대한 설명으로 가장 부적절한 것은?
>주성분 수는 데이터의 수만큼 생성이 가능하다.
32. 데이터 마이닝 프로세스 올바르게 이은 것은?
>목적 정의 > 데이터 준비 > 데이터 가공 > 기법 적용 > 검증
33. 상관 분석에 대한 설명으로 잘못된 것은?
>독립 변수에 대한 종속값을 예측한다.
34. 정상성을 가진 시계열 모델의 특징에 대한 설명으로 옳은 것은?
>시계열의 평균과 분산이 시간의 흐름에 따라 변하지 않고 일정하게 유지된다.
35. 잔고와 수입에 따른 신용카드 연체 가능성을 회귀 분석한 결과를 주고 옳지 않은 것은?
> 밸런스가 고정일 때 소득이 증가하면 디폴트가 감소한다.
36. 다음 중 분류 분석의 정의로 가장 올바른 것은?
> 이미 분류된 데이터를 바탕으로 새로운 데이터가 어떤 그룹에 속하는지 예측하는 분석 기법이다.
37. 신경망 모델에 대한 설명으로 적절하지 않은 것은?
>렐루(ReLU) 함수를 활성화 함수로 사용할 때, 은닉층이 없는 인공신경망은 로지스틱 회귀 모형과 동일한 특성을 가진다.
38. 다층 퍼셉트론에서 은닉층이 1개일 때 가중치의 수를 구하는 문제/연결 선의 개수를 구하면?
• 입력층(Input Layer): 20개 노드
• 은닉층(Hidden Layer): 50개 노드
• 출력층(Output Layer): 3개 노드
>1150
39. 시그모이드(Sigmoid) 함수의 출력값 범위로 알맞은 것은?
>0 <= y <= 1
40. 다음 중 부스팅(Boosting)에 대한 설명으로 옳은 것은?
>여러 개의 모델을 순차적으로 학습시켜 예측 성능을 향상시킨다.
41. 신경망 모델에 대한 설명으로 옳지 않은 것은?
> 모든 은닉층 노드의 수는 동일하다.
42. 다층 퍼셉트론(MLP)에서 출력층의 결과가 다변(multiclass)일 때 주로 사용하는 활성화 함수는 무엇인가?
>Softmax 함수
43. 1-특이도를 X축으로 삼고 민감도를 Y축으로 갖는 그래프는?
>ROC 커브
44. 다음 중 실제로 참인 데이터(Positive) 중에서 모델이 참(Positive)으로 예측한 비율을 나타내는 지표는 무엇인가?
>재현율
45. 분류 나무에서 가지치기의 기준 중 가장 적절하지 않은 것은?
>잔차 제곱합
46. K-Means 군집 분석에서 초기 군집 중심(centroid)을 선택하는 방법으로 옳은 것은?
>데이터 집합에서 무작위로 추출한다.
47. 연관분석에서 최소 지지도를 2로 설정했다. 다음 보기 중 최대 길이의 빈발항목 집합으로 옳은 것은?
>{b, c, e}
48. 다음 중 연관분석에 관한 설명 중 옳지 않은 것은?
>A→B일 때, 지지도보다 신뢰도가 더욱 중요한 지표이다.
49. 다음 표는 특정 기간 동안 판매된 음료 구매 건수를 나타낸 것이다. “커피 → 우유”의 지지도(Support)를 구하시오.
>0.3
50. 최장연결법을 이용하여 군집 분석을 수행한 결과에 대한 설명으로 옳지 않은 것은?
> 다시 최장연결법으로 분석 해도 결과가 고정된다.
문제는 복원되는 과정에서 문제의 순서가 틀릴 수 있으며, 정확히 복원이 되지 않은 문제가 있을 수 있습니다. 또, 복원된 문제가 수정될 수 있고 정답도 변경될 수 있습니다.
문제와 정답에 이견이 있으신 분들은 댓글을 이용해 주시기 바랍니다.
의견을 주시면 반영하여 바로 수정할 수 있도록 하겠습니다.
로그인이 필요합니다.
로그인 하시겠습니까?
댓글을 삭제하시겠습니까?
게시글을 삭제하시겠습니까?
댓글
댓글 1