<?xml version="1.0" encoding="UTF-8"?>
<rss xmlns:dc="http://purl.org/dc/elements/1.1/" version="2.0">
<channel>
<title>信息技术－工作文稿</title>
<link>http://dspace.xmu.edu.cn/handle/2288/133</link>
<description>SISE－Working Paper</description>
<pubDate>Sun, 09 Jul 2017 18:05:25 GMT</pubDate>
<dc:date>2017-07-09T18:05:25Z</dc:date>
<item>
<title>Google BigTable</title>
<link>http://dspace.xmu.edu.cn/handle/2288/71572</link>
<description>Google BigTable
林子雨
BigTable是一个分布式存储系统，它可以支持扩展到很大尺寸的数据：PB级别的数据，包含几千个商业服务器。Google的许多项目都存储在BigTable中，包括WEB索引、Google Earth 和Google Finance。这些应用对BigTable提出了截然不同的需求，无论是从数据量（从URL到网页到卫星图像）而言，还是从延迟需求（从后端批量处理到实时数据服务）而言。尽管这些不同的需求，BigTable已经为所有的Google产品提供了一个灵活的、高性能的解决方案。本文中，我们描述了BigTable提供的简单数据模型，它允许客户端对数据部署和格式进行动态控制，我们描述了BigTable的设计和实施。
</description>
<pubDate>Thu, 01 Jul 2010 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://dspace.xmu.edu.cn/handle/2288/71572</guid>
<dc:date>2010-07-01T00:00:00Z</dc:date>
</item>
<item>
<title>超大数据库会议XLDB2011大会报告</title>
<link>http://dspace.xmu.edu.cn/handle/2288/71573</link>
<description>超大数据库会议XLDB2011大会报告
林子雨
第5届XLDB大会，把业界用户、开发人员和超大数据的研究人员聚集在一起，关注医疗和基因学领域所面临的挑战，以及把统计信息应用于大规模分析时（包括机器学习）所面临的挑战。会议讨论的主要问题包括：缺少可扩展的应用、缺少开发相应解决方案的经验、缺少对大数据问题的关注和重视、数据量的增长超过了摩尔定律、扩展性差的算法、较差的数据质量和集成。会议认为，在用户、开发人员和研究人员之间，需要更多的交流和沟通。会议讨论了许多对三个群体都有用的未来工作，包括收集挑战问题，以及与特定的业界和学术界群体建立联系等等。
</description>
<pubDate>Tue, 01 May 2012 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://dspace.xmu.edu.cn/handle/2288/71573</guid>
<dc:date>2012-05-01T00:00:00Z</dc:date>
</item>
<item>
<title>超大数据库会议XLDB2007大会报告</title>
<link>http://dspace.xmu.edu.cn/handle/2288/71575</link>
<description>超大数据库会议XLDB2007大会报告
林子雨
近些年，工业界和科学领域的数据集，无论在数量上还是在复杂性上，都有了巨大的增长。最大的事务型数据库和数据仓库，再也无法使用现成的商业数据库管理系统产品进行有效地存储和管理。目前，也存在其他一些专门讨论数据库和数据仓库的论坛，但是，他们通常只关注小规模数据问题，而且往往不怎么关注实际解决方案以及对数据库厂商的影响。鉴于目前的超大规模数据库的用户还比较少（但是影响力很大，并且正在迅速增加），并且缺少在超大规模数据库方面交流经验知识的机会，因此，我们组织举办了超大数据库会议。本文是这次大会的讨论和相关活动的总结报告。
</description>
<pubDate>Tue, 01 May 2012 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://dspace.xmu.edu.cn/handle/2288/71575</guid>
<dc:date>2012-05-01T00:00:00Z</dc:date>
</item>
<item>
<title>超大数据库会议XLDB2008大会报告</title>
<link>http://dspace.xmu.edu.cn/handle/2288/71574</link>
<description>超大数据库会议XLDB2008大会报告
林子雨
在科学界和业界，大规模分析的复杂性已经在近些年有了很大的提升。分析人员正在努力尝试使用复杂的技术，比如时间序列分析和分类算法，因为他们平时所熟悉的工具，虽然功能强大，但是可扩展性较差，无法有效使用可扩展的数据库系统。第2届XLDB大会，主要目的在于了解这些存在的问题，剖析这些问题的背后原因，并寻找相应的解决方案。大会还讨论了建设一个新的开源科学数据库SciDB，这个构想是在第1届XLDB大会（XLDB2007）上提出来的。本文是本次大会活动和讨论的总结报告。
</description>
<pubDate>Tue, 01 May 2012 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://dspace.xmu.edu.cn/handle/2288/71574</guid>
<dc:date>2012-05-01T00:00:00Z</dc:date>
</item>
<item>
<title>Google Spanner</title>
<link>http://dspace.xmu.edu.cn/handle/2288/71571</link>
<description>Google Spanner
林子雨
Spanner是谷歌公司研发的、可扩展的、多版本、全球分布式、同步复制数据库。它是第一个把数据分布在全球范围内的系统，并且支持外部一致性的分布式事务。本文描述了Spanner的架构、特性、不同设计决策的背后机理和一个新的时间API，这个API可以暴露时钟的不确定性。这个API及其实现，对于支持外部一致性和许多强大特性而言，是非常重要的，这些强大特性包括：非阻塞的读、不采用锁机制的只读事务、原子模式变更。
</description>
<pubDate>Sat, 01 Sep 2012 00:00:00 GMT</pubDate>
<guid isPermaLink="false">http://dspace.xmu.edu.cn/handle/2288/71571</guid>
<dc:date>2012-09-01T00:00:00Z</dc:date>
</item>
</channel>
</rss>
