[컴퓨터과학개론] 컴퓨터와 데이터 -2
데이터와 정보
데이터와 정보의 관계
-
I = P(D)
- 데이터 D
- 현실 세계로부터 관찰이나 측정을 통해 단순히 얻어지는 값/사실
- 현실 세계로부터 관찰이나 측정을 통해 단순히 얻어지는 값/사실
- 처리기 P
- 데이터 처리
- 정보 처리
- 데이터 처리
- 정보 I
- 어떤 상황에 대해 적절한 의사결정을 수행할 수 있게 하는 지식
- 어떤 상황에 대해 적절한 의사결정을 수행할 수 있게 하는 지식
데이터의 표현 형태
- 데이터의 유형과 무관하게 일관된 표현 방식
- 문자, 정수/실수, 이미지, 오디오, 비디오 등
- 비트 패턴
- 문자, 정수/실수, 이미지, 오디오, 비디오 등
- 메모리에 저장된 데이터 유형에 맞는 해석과 처리가 필요
- 입출력 장치나 프로그램의 책임
- 입출력 장치나 프로그램의 책임
데이터의 표현 단위
- 비트(bit)
- 바이트 (byte)
- KB, MB, GB, TB, PB, EB, ZB, YB
- 워드 (word)
- 컴퓨터 연산의 기본 단위가 되는 정보의 양
- 32bit, 64bit
- 컴퓨터 연산의 기본 단위가 되는 정보의 양
진법
- 수를 세는 방법 또는 단위
-
r진수 : 0,1, …, (r-1)까지의 숫자만을 사용해서 표현한 수
- 각 위치에 따른 서로 다른 가중치(자릿값)가 존재
문자
- 키보드를 통해 입력되는 문자도 2진수로 표현되어 처리
-
각 문자마다 유일한 값으로써 코드를 할당할 수 있는 약속된 문자 체계가 필요
- ASCII
- 미국표준협회 (ANSI)
- 7비트 코드 → 128개(2^7^)의 서로 다른 문자 표현
- 미국표준협회 (ANSI)
- 유니코드
- 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계 된 산업 표준
-
- 애플 컴퓨터, IBM, MS 등의 컨소시엄으로 설립한 유니코드가 첫 버전 발표
- 애플 컴퓨터, IBM, MS 등의 컨소시엄으로 설립한 유니코드가 첫 버전 발표
- 1995년 국제 표준으로 제정. 공식명칭 : ISO/IC 10646-1
- 사용 중인 플랫폼, 프로그램, 언어에 무관
- 16비트 코드 체계 → 65,363개(2^16^)의 서로 다른 문자 표현
- 세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계 된 산업 표준
- EBCDIC
- IBM 개발, 8비트 코드 → 실제 사용되는 문자 코드 127
- IBM 메인프레임에서만 사용
- IBM 개발, 8비트 코드 → 실제 사용되는 문자 코드 127
- BCD
- 4비트로 구성된 열 개의 코드로 10진수를 표현 → 8421 코드
- 4비트로 구성된 열 개의 코드로 10진수를 표현 → 8421 코드