[Dataverse]The Dataverse Project 네이버에 검색하면 안나오는 dataverse.org에 대하여
인턴 시작하면서 6월에 알게된 건데,
아직 네이버에는 정보가 없어서 공부할 겸 정리해보는 글
1. Dataverse가 뭐람?
Dataverse는 Data+Universe의 합성어로, 연구 데이터를 저장, 공유 및 관리하기 위한 오픈 소스 웹 어플리케이션이다.
왜 하필 "Universe" 단어라고 하면은..평행세계..평행우주..의 개념을 도입해서 그렇다고 한다(들은 바로는 그렇다)
나의 데이터가 다른 사람의 데이터 안에도 들어있고..뭐 그런 복잡한 느낌
Dataverses, Datasets, Files 이렇게 3가지가 있는데
Dataverses = 폴더
Datasets = 폴더 안에 있는 폴더
Files = 파일
이라고 생각하면 된다.
굳이 정리해보자면 이런 느낌..?
Dataverse 안에 또 다른 Dataverse들을 무한히 생성할 수 있다(그래서 Universe인가..?)
이렇게 COSS Dataverse 안에 SMDB Most Loved라는 Dataverse를 하나 만들고,
이 안에 "미쓰 와이프", "방가? 방가!" 등의 Datasets을 넣을 수 있다.
Dataset 안에는 파일도 넣을 수 있는데, 파일 형태는 pdf, csv, jpg 등 다양하
2. Dataverse.org란?
엔드포인트가 org인, Dataverse 소프트웨어의 홈페이지이다.
이 웹 사이트에서는 Dataverse 소프트웨어에 대한 정보, 다운로드 링크, 문서 및 지원 리소스를 찾을 수 있다.
또한 Dataverse.org은 전 세계적으로 운영되는 다양한 Dataverse 인스턴스의 목록을 제공하여 사용자가 연구 데이터를 검색하고 액세스할 수 있는 커뮤니티를 형성합니다.
The Dataverse Project - Dataverse.org
dataverse.org
3. Dataverse, 왜 쓰는데?
Dataverse는 이름 속에 들어있는 "Data"에서도 유추할 수 있듯이 데이터를 다루는 데이터 플랫폼이다.
서울대학교와 하버드대학교가 공동개발했다고는 하지만..하버드대학교가 주관하고 서울대학교가 참여한 형태인 것 같다.
핵심 기능 5가지!
데이터 게시 | 데이터를 자유롭게 올릴 수 있고, 게시된 데이터셋에는 메타데이터(제목, 작성자, 설명 등)와 실제 데이터 파일이 포함된다 |
버전 관리 | 깃에서 할 수 있는 버전 관리, Dataverse에서도 가능 |
접근 제어 | 각 데이터셋 혹은 파일에 접근권한을 다르게 설정하여 비공개로 유지하거나 특정 사용자 혹은 그룹과 공유할 수 도 있다 |
검색 및 탐색 | 데이터셋의 메타데이터를 색인화하여 모든 문구를 검색 가능, 필터링 옵션을 사용하여 원하는 데이터를 찾고 탐색 |
API 지원 | Dataverse API를 사용하여 프로그래밍 방식으로 상호작용하고 외부 시스템과 통합 가능 |
4. Dataverse API
API Request를 통해 데이터를 추가할 수도, 삭제할 수도, 조회할 수도 있다.
API Guide — Dataverse.org
guides.dataverse.org
새로운 프로젝트에 또 다시 일하게 되었는데, 이 프로젝트에서도 Dataverse를 쓴다고 해서
다시 Dataverse 공부 중이다..