Dataverse

[Dataverse]The Dataverse Project 네이버에 검색하면 안나오는 dataverse.org에 대하여

민아당긴아 2023. 10. 10. 09:32

인턴 시작하면서 6월에 알게된 건데,

아직 네이버에는 정보가 없어서 공부할 겸 정리해보는 글

1. Dataverse가 뭐람?

Dataverse는 Data+Universe의 합성어로, 연구 데이터를 저장, 공유 및 관리하기 위한 오픈 소스 웹 어플리케이션이다.

왜 하필 "Universe" 단어라고 하면은..평행세계..평행우주..의 개념을 도입해서 그렇다고 한다(들은 바로는 그렇다)

나의 데이터가 다른 사람의 데이터 안에도 들어있고..뭐 그런 복잡한 느낌

Dataverses, Datasets, Files 이렇게 3가지가 있는데

Dataverses = 폴더

Datasets = 폴더 안에 있는 폴더

Files = 파일

이라고 생각하면 된다.

굳이 정리해보자면 이런 느낌..?

Dataverse 안에 또 다른 Dataverse들을 무한히 생성할 수 있다(그래서 Universe인가..?)

이렇게 COSS Dataverse 안에 SMDB Most Loved라는 Dataverse를 하나 만들고,

이 안에 "미쓰 와이프", "방가? 방가!" 등의 Datasets을 넣을 수 있다.

Dataset 안에는 파일도 넣을 수 있는데, 파일 형태는 pdf, csv, jpg 등 다양하

2. Dataverse.org란?

엔드포인트가 org인, Dataverse 소프트웨어의 홈페이지이다. 

이 웹 사이트에서는 Dataverse 소프트웨어에 대한 정보, 다운로드 링크, 문서 및 지원 리소스를 찾을 수 있다.

또한 Dataverse.org은 전 세계적으로 운영되는 다양한 Dataverse 인스턴스의 목록을 제공하여 사용자가 연구 데이터를 검색하고 액세스할 수 있는 커뮤니티를 형성합니다.

 

The Dataverse Project - Dataverse.org

 

dataverse.org

3. Dataverse, 왜 쓰는데?

Dataverse는 이름 속에 들어있는 "Data"에서도 유추할 수 있듯이 데이터를 다루는 데이터 플랫폼이다.

서울대학교와 하버드대학교가 공동개발했다고는 하지만..하버드대학교가 주관하고 서울대학교가 참여한 형태인 것 같다.

핵심 기능 5가지!

데이터 게시 데이터를 자유롭게 올릴 수 있고, 게시된 데이터셋에는 메타데이터(제목, 작성자, 설명 등)와 실제 데이터 파일이 포함된다
버전 관리 깃에서 할 수 있는 버전 관리, Dataverse에서도 가능
접근 제어 각 데이터셋 혹은 파일에 접근권한을 다르게 설정하여 비공개로 유지하거나 특정 사용자 혹은 그룹과 공유할 수 도 있다
검색 및 탐색 데이터셋의 메타데이터를 색인화하여 모든 문구를 검색 가능, 필터링 옵션을 사용하여 원하는 데이터를 찾고 탐색
API 지원 Dataverse API를 사용하여 프로그래밍 방식으로 상호작용하고 외부 시스템과 통합 가능

 

4. Dataverse API

API Request를 통해 데이터를 추가할 수도, 삭제할 수도, 조회할 수도 있다.

 

API Guide — Dataverse.org

 

guides.dataverse.org

열심히 Dataverse API 공부하던 지난 흔적들..

새로운 프로젝트에 또 다시 일하게 되었는데, 이 프로젝트에서도 Dataverse를 쓴다고 해서

다시 Dataverse 공부 중이다..