디지털 아카이버스트들이 사라져버릴 공공 데이터를 보존하기 위해 노력하고 있습니다

Image by Bernard Goldbach, from Flickr

디지털 아카이버스트들이 사라져버릴 공공 데이터를 보존하기 위해 노력하고 있습니다

읽는 시간: 2 분

30년 이상 동안, 인터넷 아카이브의 웨이백 머신은 연구에 중요한 정부 웹사이트와 데이터셋을 보존해왔습니다. 이에 대한 자세한 내용은 Spectrum의 새로운 보고서에서 확인하실 수 있습니다.

급하신가요? 여기에 간단한 사실들이 있습니다:

  • 웨이백 머신은 과학 및 엔지니어링 연구에 필수적인 자료로 활용되는 중요한 정부 데이터를 유지합니다.
  • 트럼프 대통령의 두 번째 임기 동안 8,000개 이상의 정부 웹 페이지와 데이터베이스가 공개 접근에서 사라졌습니다.
  • 하버드 대학교의 라이브러리 혁신 연구소는 Data.gov 컬렉션의 일부인 311,000개의 데이터셋을 성공적으로 보존하였습니다.

이 기록들은 NASA와 National Science Foundation 같은 기관들로부터 제공받은 필수적인 데이터를 담고 있습니다. 이런 데이터들이 사라진다면, Spectrum에서 언급했듯이 연구의 타당성과 역사적 정확성이 위협받게 됩니다.

정부 데이터의 삭제는 새로운 현상이 아닙니다. 9/11 이후부터 부시 행정부는 보안상의 이유로 수백만 바이트의 정보를 삭제하였습니다. 오바마 행정부는 이와 다른 접근법을 취해, 2009년에 Data.gov을 론칭하여 공개 접근을 확대하였습니다. 이는 Spectrum이 보도하였습니다.

트럼프 대통령의 첫 임기 동안, 환경 데이터 & 정부 이니셔티브에서 연구원들이 일부 정부 웹사이트에 접근할 수 없게 되었으며, 여러 페이지에서 “기후 변화”에 대한 참조가 삭제되었다고 Spectrum이 말하고 있습니다.

트럼프의 두 번째 임기 동안, 데이터 보존에 대한 우려가 증가하였습니다. 2월에, 뉴욕 타임스는 8,000개가 넘는 정부 웹 페이지와 데이터베이스가 내려진 것을 보도하였습니다.

일부는 다시 나타났지만, 그리스트는 ‘기후 변화’와 ‘청정 에너지’와 같은 용어의 삭제를 포함한 변화를 발견하였습니다. 2월 11일에는 법적 분쟁이 이어졌고, 연방 판사는 스펙트럼이 보도한 바와 같이 특정 CDC와 FDA 데이터셋의 복원을 명령하였습니다.

이러한 손실에 대응하기 위해, 디지털 아카이비스트들이 행동에 나섰습니다. 하버드 로스쿨의 라이브러리 혁신 연구소는 Data.gov의 전체 16 테라바이트 아카이브를 복사했는데, 이는 311,000개가 넘는 데이터셋을 포함하고 있습니다. 그들은 API를 통한 자동화된 쿼리를 사용하여 매일 업데이트를 유지합니다.

아카이비스트들은 미래 세대를 위해 과거의 기록을 유지함으로써 지식을 보호하는 중요한 역할을 합니다. 그들이 없어지면 중요한 정보가 손실되어 공공 기록이 재작성되어야 하며, 이는 미래의 연구 가능성을 제한하게 될 것입니다.

이 기사가 마음에 드셨나요? 평가해 주세요!
정말 싫습니다 별로 좋아하지 않습니다 괜찮습니다 꽤 좋습니다! 정말 좋습니다!

마음에 드셨다니 기쁩니다!

Trustpilot에 여러분의 의견을 남겨 주실 수 있으실까요? 리뷰는 WizCase에게 큰 힘이 됩니다. 감사합니다!

Trustpilot에 리뷰 남기기
0 0명의 사용자가 투표
제목
코멘트
피드백을 주셔서 감사합니다
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

댓글 달기

Loader
Loader 더 보기