【24h】

Data Warehouse, Bronze, Gold, STEC, Software

机译:数据仓库,铜牌,金,Stec,软件

获取原文

摘要

We are building an analytical data warehouse for linguistic data - primarily lexicons and phonological data - for languages in the Asia-Pacific region. This paper briefly outlines the project, making the point that the need for improved technology for endangered and low-density language data extends well beyond completion of fieldwork. We suggest that shared task evaluation challenges (STECs) are an appropriate model to follow for creating this technology, and that stocking data warehouses with clean bronze-standard data and baseline tools - no mean task - is an effective way to elicit the broad collaboration from linguists and computer scientists needed to create the gold-standard data that STECs require.
机译:我们正在构建一个用于语言数据的分析数据仓库 - 主要是词典和语音数据 - 用于亚太地区的语言。本文简要概述了该项目,使得对濒危和低密度语言数据的改进技术的需求远远超出了实地考察的完善。我们建议共享任务评估挑战(Stecs)是一个适当的模型,用于创建这项技术,以及使用清洁的青铜标准数据和基线工具的库存数据仓库 - 没有平均任务 - 是引出广泛合作的有效方式语言学家和计算机科学家需要创建STEC所需的金标准数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号