Medium Archive

个人文章存档 · 从 Medium 导出

让 165 年的新闻业在线可用需要什么

::: {#5d04 .section .section .section—body .section—first .section—last} ::: section-divider


:::

::: section-content ::: {.section-inner .sectionLayout—insetColumn}

让 165 年的新闻业在线可用需要什么 {#2126 .graf .graf—h3 .graf—leading .graf—title name=“2126”}

正如《大西洋月刊》的副执行主编莎拉·雅格所说,做新闻实际上就是创造我们周围世界的记录。它是关于记录正在发生的事情,并希望帮助读者理解它。**能够从过去发生的事情中学习,**以及历史是如何被实时解读的,这具有巨大的价值。

自 1995 年开始在线出版以来,《大西洋月刊》就一直希望将其档案数字化。那时,我们杂志的网站为人们提供了一个新的机会,让他们可以在线阅读我们当天撰写的新闻。然而,我们的杂志自 1857 年秋天以来一直在不断印刷和出版。有很多故事是我们的读者无法在线访问的。有时,编辑们会手动复制档案文章,但在将近 30 年的时间里,让档案可用的艰巨任务仍然难以实现。

如何从我们的印刷页面中提取数万个单词并将其发布到互联网上?大西洋如何突然从不提供这些内容转变为在其数据结构和网站上显示这些内容?到达那里的机械步骤是什么?这些是我们的产品和技术同事在 2021 年 5 月问自己的一些问题,当时该杂志致力于将档案带到网上的挑战。

第一步 {#4595 .graf .graf—h3 .graf-after—p name=“4595”}

在这种规模的项目开始时,对于它应该是什么样子,它可能包含的所有功能都有很多不同的看法。正如产品执行总监 Carson Trobich 所解释的那样,很难弄清楚如何将这么大的东西放在第一步中。

“你需要确定你的雄心壮志的局限性,并将最初的兴奋投入到研究中。“Carson Trobich,产品执行总监

为了确定我们的愿景并找到第一步,我们的产品同事研究了 20 家出版商,以了解他们如何重现和重新打包存档内容。

该团队发现,一些出版商的档案仅包含打印页面的扫描件,而其他出版商则将页面转换为数字文本。档案可以完全在线提供,也可以只部分提供。它可以存在于与现代内容相邻的出版商网站上,也可以是具有附加功能的独立产品。一些档案甚至脱离平台。

《大西洋月刊》很早就决定,我们的目标是提供完整的档案。为了对我们的读者透明,并为了历史记录,我们想分享这一切 --- --- 从我们最经久不衰的报道到一些理所当然地变得默默无闻的故事。正如我们的主编Jeffrey Goldberg在介绍该项目的编者注中所写,“一切都在这里:好的,坏的,聪明的,令人反感的,荒谬的。我们从一开始就知道我们不会进行任何审查、修整或回避。”

通过为存档在当前网站上建立空间,我们的产品同事致力于在我们的现代文章模板中数字化和展示过去的文章。这些是他们到达那里所遵循的步骤:

1) 转录内容: The Atlantic 带着它曾经出版过的所有页面的 PDF 扫描件参与了这个项目。为了理解所有这些信息,我们的工程团队与一家专门从事数字化媒体杂志档案的供应商合作。承包商使用光学字符识别和高分辨率扫描来识别每一页内的不同区域和区域 --- --- 映射大西洋曾经印刷的所有内容的位置。

第一步还需要一个架构定义,它教会供应商识别他们正在数字化的内容并为内容摄取奠定基础。通过这种方式,供应商学会了如何识别内容类型(例如标题或页码)并以我们自己的内部系统可以理解的方式标记它们。

这个过程产生了非常详细的 XML 文件、PDF 和 JPEG 包,总计 400 GB 的数据。

**2) 摄取数据:**下一步是将其全部导入我们的 CMS。在我们的工程同事可以这样做之前,他们需要评估档案中的内容类型,以确定应该或不应该导入的内容。为此,他们建立了一个包含 110,000 条内容的索引。在导入过程中,并非所有这些都会变成文章页面。例如,刚刚超过一半是广告。

正如我们的系统架构师Chris Barna所描述的,工程通常会受到资源限制。他们在这里遇到了相反的问题 --- --- 信息太多。该团队缩小了《大西洋月刊》希望在数字档案中重新发布的范围:文章、短篇小说和诗歌。或者更好的是,我们不想发布的内容:广告、目录。然后,他们采用该索引并将其转化为我们 CMS 中的文章,就像我们上传当代杂志文章的方式一样。效果很好 --- --- 直到他们开始遇到问题。

“对于我们的系统,一次发布 30 篇文章很容易。我们需要一次发表一千篇文章。“
Chris Barna,系统架构师

**3) 一次发布数千篇文章:**转换和导入过程的许多后期阶段都是关于采取我们的批量操作并使它们变得更庞大。也就是说,从经营一期杂志扩展到经营一年甚至十年的内容。

当我们的产品和工程同事弄清楚流程的数字化部分时,受众研究团队与读者进行了交谈,以确定他们是否以及如何使用大西洋的档案。因为将档案数字化和将其变成读者喜欢的产品是两件不同的事情:

数字化是将印刷档案转录为可消费和有用的格式。

产品化包括构思、研究和执行我们如何向观众展示这些内容。

了解读者对我们新闻深度的体验是了解我们应该关注什么样的产品开发的关键。如果有的话,这一切将如何适应我们读者的生活?

在与大西洋读者进行访谈后,受众研究团队确定了档案发现的两个主要概况。我们称他们为探索者和冲浪者。

求道者通常研究特定主题或时间段,主要是出于专业目的。他们深入参与并经常使用搜索功能来查找档案。

冲浪者在网上冲浪时会偶然发现档案。他们出于好奇心,想要了解当代问题的历史背景。

冲浪者多于寻求者,但他们参与的深度和频率都较低。无论我们选择什么产品和设计方向,我们都希望以两种模式为我们的读者服务。

不会低估我们读者的语境 {#f695 .graf .graf—h3 .graf-after—p name=“f695”}

从设计的角度来看,**存档出版物提供了一个机会,可以让人们在我们的网页上朝着特定的方向移动,提供线索并帮助他们浏览我们的网站。**我们的设计团队希望人们记住它本质上是一种工具。他们希望读者使用它来浏览和查找内容。

该设计部分于 2021 年 12 月左右开始。我们的设计团队计划使用标准的 Atlantic 文章页面,并为存档体验引入一些新功能。例如,每个档案页面都会包含一个再循环模块,以鼓励读者继续探索。它还会促使他们阅读刊登该文章的整期杂志。从本质上讲,这与我们在当代杂志中采用的方法相同。

提供上下文也是关键。所有这些过去的文章突然都将提供给我们的读者。由于《大西洋月刊》将使用与我们现代杂志相同的格式,因此设计团队旨在为读者提供工具以快速识别每篇文章的发布时间。他们希望读者能够理解什么时候来自档案,而不是当前的新信​​息。他们希望在不低估我们的观众的情况下实现这一目标,在不让读者感到警告的情况下提供意识。

我们的高级产品设计师之一克里斯托弗·切斯特 (Christopher Chester) 希望确保人们了解他们可以轻松地跳入档案库来浏览杂志。如果他们在存档中并且想查看最新一期,他们可以这样做。他还想将我们的杂志页面链接回档案,以便读者始终看到他们可以快速浏览大西洋的丰富历史。

“对我来说,档案馆感觉就像是对杂志的庆祝。我开始想,如果我们正在查看我们的档案,我想将它与我们的实体版本联系起来。“
Christopher Chester,高级产品设计师

Atlantic 文章的结构自 1857 年以来就发生了变化。在我们的杂志中,我们现在有带有 subhead 或dek的故事,而以前并非如此。几十年来,文章没有在标题下方包含描述。幸运的是,我们的现代文章结构可以适应每个故事的内容。例如,我们可以发布有主角图片和没有主角图片的故事。这种灵活性使我们能够尊重原始材料并忠实地重新发布出现在大西洋页面上的档案内容。

专注于主要目标 {#fa82 .graf .graf—h3 .graf-after—p name=“fa82”}

Atlantic 档案库于 2022 年 7 月启动 --- --- 在我们的产品和技术团队负责构建它的一年多之后。除了修改后的文章页面外,它还包括自己的登陆页面和完全重新设计的杂志部分,不仅可以帮助读者浏览 165 年的大西洋封面,还可以表彰在整个大西洋历史上为大西洋做出贡献的作家。

启动时,档案馆仍面临一些挑战。没有任何档案数字化是完美的:此类过程中总会出现偶尔的拼写错误和格式问题。尽管如此,我们的团队还是专注于首要目标:将档案交到读者手中。

创造产品时很容易陷入细节,力求完美。在现实中,追求完美不仅是不可能的,而且还会适得其反。重要的是要认识到您仍然可以提供出色的体验并满足各种读者的需求而无需达到完美。

作为一个产品团队,我们还有很多机会可以探索。例如,我们的读者几十年来一直没有机会探索广告。那只是一个例子。我们的内容如此丰富,我们仍然有机会构建其他东西。

What it takes to make 165 years of journalism available online{.markup—anchor .markup—p-anchor data-href=“https://building.theatlantic.com/what-it-takes-to-make-165-years-of-journalism-available-online-7958021646af” rel=“noopener” target=“_blank”} ::: ::: :::

← 返回文章列表