Data Modeling & ERD Diagram
1.데이터 모델링이란?
데이터 모델링이란 정보시스템 구축의 대상이 되는 업무 내용을 분석하여 이해하고 약속된 표기법에 의해 표현 하는걸 의미한다. 그리고 이렇게 분석된 모델을 가지고 실제 데이터베이스를 생성하여 개발 및 데이터 관리에 사용된다.
특히 데이터를 추상화한 데이터 모델은 데이터베이스의 골격을 이해하고 그 이해를 바탕으로 SQL 문장을 기능과 성능적인 측면에서 효율적으로 작성할 수 있기 때문에, 데이터 모델링은 데이터베이스 설계의 핵심과정이라고 할 수 있다.

2.데이터 모델링 순서 절차
2-1.업무 파악(요구사항 수집 및 분석)
업무 파악은 어떠한 업무를 시작하기 전에 해당하는 업무에 대해서 파악하는 단계.
모델링에 앞서 가정 먼저 해야할 것은 어떠한 업무를 데이터화하여 모델링 할 것인지에 대한 요구사항 수집일 것이다. 업무파악을 하기 좋은 방법은 UI를 의뢰인과 함께 확인해 나가는 것이다. 그리고 궁극적으로 만들어야 하는 것이 무엇인지 알아보아야 한다.
우리가 흔히 사용하는 게시판 (Okky) 을 예로 살펴보자

2-2 개념적 데이터 모델링
개념적 데이터 모델링은 내가 하고자 하는 일의 데이터 간의 관계를 구상하는 단계이다. 각 개체들과 그들간의 관계를 발견하고 표현하기 위해 ERD 다이어그램을 사용한다.

업무파악 단계에서 결정했던 게시판 데이터 구상을 개념적 데이터 모델로 구현한 것.
게시판에는 대표적으로 게시판 이용자의 회원 정보, 로그인 정보, 그리고 게시판의 게시글, 댓글이 있다.

2-3 논리적 데이터 모델링
개념적인 데이터 모델이 완성되면, 구체화된 업무 중심의 데이터 모델을 만드는데, 이것을 논리적인 데이터 모델링이라고 한다. 이 단계에서 업무에 대한 Key, 속성, 관계등을 표시하며, 정규화를 수행한다. 정규화는 데이터 모델의 일관성을 확보하고 중복을 제거하여 신뢰성있는 데이터 구조를 얻는데 목적이 있다.
이때, 단순히 추상적인 데이터에서 보다 구체화한 데이터로 작성한다. 예를 들어 회원정보의 아이디, 비밀번호에 각 데이터 타입을 명시하고, 각 데이터간의 관계를 정밀하게 맺어주며 테이블의 키(Key)를 지정해준다.

2-4 물리적 데이터 모델링
물리적 데이터 모델링은 최종적으로 데이터를 관리할 데이터베이스를 선택하고, 선택한 데이터 베이스에 실제 테이블을 만드는 작업을 말한다. 시각적인 구조를 만들었으면 그것을 실제로 SQL 로 완성하는 단계라고 보면 된다.

데이터 모델링 절차 정리
1. 게시판의 화면에 어떠한 것들이 필요한지에 대한 개념을 잡기 (요구사항 수집)
2.게시판의 화면에 표현되는 데이터를 파악해 관계를 설정(개념적 데이터 모델링)
3.개념적 데이터 모델링 한 것을 표로 만들기 (논리적 데이터 모델링)
4.실제 데이터베이스 테이블로 만들기 (물리적 데이터 모델링)

3. ERD 그리기
ERD (Entity Relationship Diagram)는 단어에서 의미하는 그대로 'Entity 개체'와 'Relationship관계'를 중점적으로 표시하는 데이터베이스 구조를 한 눈에 알아보기 위해 그려놓는 다이어그램이다. 개체 관계도라고도 불리며 요구분석사항에서 얻은 엔티티와 속성들의 관계를 그림으로 표현한 것이다.

엔티티(Entity)
엔티티는 정의 가능한 사물 또는 개념을 의미한다.
사람도 될수 있으며 프로필이나 도서정보와 같은 무형의 정보도 데이터화가 가능하다.
데이터베이스의 테이블이 엔티티로 표현된다고 보면 된다.
예를들어 학생 Entity는 아래의 그림과 같이 표현된다.

엔티티 속성(Attribute)
엔티티에는 개체가 갖고있는 속성(Attribute)을 포함한다.
예를들어 학생 엔티티라면, 학번, 이름, 주소, 전공 ..등 속성들이 있다.
데이터베이스의 테이블의 각 필드(컬럼)들이 엔티티 속성이라고 보면 된다.

엔티티 도메인(Domain)
도메인은 속성의 값, 타입, 제약사항 등에 대한 갑의 범위를 표현하는 것이다.
사용자 기호에 따라 속성 타입만 그릴수도 있고, 가독성을 위해서 생략할 수도 있다.
이때 데이터 타입을 명시할때, 데이터베이스가 지원하는 타입에 맞게 해야한다.
엔티티 분류
엔티티는 저장하는 데이터 정보 주제에 따라 종류가 다양하다.
고객 정보같은 실제로 물리적인 형태로 있는 정보와 구매 이력같은 무형적이고 개념적인 정보가 있다.
이 엔티티 분류 구분을 잘 해주어야 데이터베이스 설계에 있어 각 데이터 주제에 맞게 모델링을 구축할 수 있다.

다음은 위에서 만든 학생 엔티티에 학생별 취미를 표현하는 엔티티를 추가하였다. 학생 엔티티는 유형 엔티티에 속하여, 학생별 취미는 무형 엔티티에 속하게 된다.

ERD 키와 제약 조건 표기법
주식별자(PK)
데이터베이스 테이블의 Primary Key를 표현
중복이 없고 NULL 값이 없는 유일한 값에 지정하는 식별자
아래 그림과 같이 ◆ 다이아몬드로 표현하기도 하고 아니면 열쇠로도 표현하기도 한다.
그리고 주 식별자는 유일한 속성이므로 다른 속성과의 명확한 구분을 위해 구분선을 두기도 한다.

NOT NULL
해당 속성에 들어갈 값에 Null 을 비허용한다면, N 혹은 NN을 적는다.
만일 Null 허용한다면 N을 적지 않는다.

외래 식별자(FK)
데이터베이스 테이블의 Foreign Key를 표현
외래 식별자 역시 key의 일종이라 ERD 엔티티에도 열쇠 아이콘으로 표시한다. (프로그램에 따라 다를 수 있다)
외래 식별자를 표시할 때에는 선을 이어주는데 개체와 관계를 따져 표시한다.

ERD 엔티티 관계 표기법
각 엔티티 유형들을 만들었으면, 엔티티 끼리 관계가 있는 경우 선을 이어 관계를 맺어야 한다. 엔티티 끼리 관계 선을 그을때 실선으로 그을지 점선으로 그을지 나뉘는데, 두 엔티티 관계에서 부모의 키를 자식에서 PK로 사용하는지 일반 속성으로 사용하지에 따라서 표기가 다르게 된다.
실선으로 그으면 강한 관계를 나타내는 것이며 '식별자 관계'라고 불리우며, 점선으로 그으면 약한 관계를 나타내는 것이며 '비식별자 관계'라고 불리우게 된다.

식별자 관계
실선으로 표현
부모 자식 관계에서 자식이 부모의 주 식별자를 외래 식별자로 참조해서 자신의 주 식별자로 설정
아래 그림에선 자식 엔티티(학생별 취미)가 부모 엔티티(학생)의 학번을 자신의 주 식별자로 설정하였다.

비식별자 관계
점선으로 표현
부모 자식 관계에서 자식이 부모의 주 식별자를 외래 식별자로 참조해서 일반 속성으로 사용.
아래 그림에선 자식 엔티티(사원정보)가 부모 엔티티(부서정보)의 부서코드를 일반 속성으로 두었다.

ERD 관계의 카디널리티
관계가 존재하는 두 entity사이에 한 entity에서 다른 entity 몇개의 개체와 대응되는지 제약조건을 표기하기위해 선을 그어 표현한다. 대표적으로 Mapping Cardinality의 종류는 다음과 같다.

하지만 ERD 다이어그램에 위와같이 선 들을 막 긋는다면 가독성이 매우 안좋아지고 표가 더러워지기 때문에, 이러한 엔티티간의 1 대 다의 관계를 표기 하기 위해 ERD에서는 선의 끝 모양을 다르게 표시하는 방법을 사용한다.
One-to-One Cardinality (1:1 관계)
학생 신체정보는 1:1로 매칭된다.
한명의 학생은 하나의 신체정보를 갖기 때문이다.

One-to-Many Cardinality (1:N 관계)
한명의 학생은 여러개의 취미를 가질수도 있다.

Many-to-Many Cardinality (M:N 관계)
제품 엔티티 입장에서, TV 제품은 대우 티비, 삼성 티비, 애플 티비 같은 여러 제조업체 제품이 있을 수 있다.이는 냉장고나 세탁기도 마찬가지이다.
여러 기업에서 자신 만의 상표를 생산한다. 제조업체 엔티티 입장에서, 삼성 제조업체는 세탁기만 생산하는게 아니라 MP3도 같이 생산한다.실제로 삼성이나 애플 회사는 가전제품, 스마트폰, 전자기기 등 여러 종류의 제품을 생산한다.
따라서 제품과 제조업체 관계는 다 대 다 관계 된다.

Many-to-Many Cardinality 관계의 해소
그런데 두 엔티티가 다 대 다 관계에 있는 경우, 두개의 엔티티만으로는 서로를 표현하는데 부족하다.
데이터 모델링에서는 M:N 관계를 완성되지 않은 모델로 간주하여, 두 엔티티의 관계를 1:N, N:1 로 조정하는 작업이 필요하다.
따라서 두 엔티티의 관련성을 표현하기 위해서는 중간에 또 다른 엔티티를 필요로 한다. 이 중간 엔티티(업체별 제품)가 두 엔티티의 공유 속성 역할을 하게 된다.
이 부분은 데이터 모델링에서 공식 처럼 적용되는 규칙이며, ERD 프로그램에서 M:N을 잡게 된다면 자동으로 아래와 같이 조정 작업이 행해지게 된다.

ERD 관계의 참여도
관계선 각 측의 끝자락에 기호를 표시한다.
'|' 표시가 있는 곳은 반드시 있어야 하는 개체. (필수)
'O' 표시가 있다면 없어도 되는 개체. (선택)

Last updated