网络研讨会记录和问答:社会科学和人文研究的软件工具

标题是社会科学的软件和工具。bepaly提款会黑吗SAGE海洋标志的背景。

去年年底,Dr. Daniela Duca (SAGE Ocean产品经理)主持了一次网络研讨会,讨论了我们白皮书中的发现bepaly提款会黑吗社会科学研究的技术生态系统。Daniela讨论了谁在开发研究工具、谁支持和资助这些工具、他们面临的挑战以及该领域400多种工具的其他趋势。

在这个博客中,我们分享了一段网络研讨会的录音,丹妮拉也回答了听众们在研讨会中没有时间回答的问题。在下面注册观看录音,点击下面的问题查看丹妮拉的答案。

我在哪里可以找到完整的白皮书,400+工具列表,以及其他在网络研讨会上提到的数据

你可以下载白皮书全文在这里。您可以获得工具列表和其他数据收集时,我们的白皮书GitHub页面

400+的研究工具太多了!你认为会有一些被复制吗?

事实上,400是很多了,而且老实说,我们对不同领域研究得越多,就能找到越多的工具。所以我觉得至少有一半我们没有列在这里。例如,我现在正在寻找文本挖掘的工具和软件,至少还有30个可以添加。我们已经尽力避免重复,但如果你发现任何重复,请告诉我们。

跨学科的工具开发和使用是否相似,或者是否有特定的学科在这方面起主导作用?

在我们的经验中,工具的使用因项目而异,因此很难跨学科进行概括。尽管您会发现有些研究小组倾向于专门使用网络图,而其他一些研究小组倾向于文本挖掘和情感分析,尽管他们可能从类似的数据集开始。

在发展方面,特别是在社会科学的工具方面,有一些团体处于领先地位。例如,看一看大门的SoBigData,它甚至包含了一个很长的工具和工作流列表,并且合作伙伴的目标是长期维护这些工具和工作流。其他为社会科学开发工具的实验室是瑞尔森大学社会媒体实验室,数字方法倡议

如果我一定要选择一个可能在工具发展方面处于领先地位的学科,我会说是语言学和计算语言学。

我担心的是,如果我为一个项目采用一个新的、非商业的基于云的系统,那么在我完成这个项目之前,它将消失或耗尽资金/机构支持。是否有关于这些工具的生命周期或可行性或审查的可靠信息来源?

这是最相关的问题,也是很多人都在努力解决的问题,包括我们。据我所知,目前还没有硬性和快速的方法来预测一个工具是会继续存在还是会被遗忘。这在很大程度上取决于一系列因素——团队有多好,他们交付的速度有多快,解决方案解决问题的效果有多好,有多少人有这个问题,当然还有他们有多少钱或能赚多少钱来维护这个工具。这些实际上都是我们在资助软件开发或任何我们想要构建的解决方案时要考虑的事情。

当你想要为你的项目使用一个工具,并且你想确保你不会在一个你不能继续计划的位置结束时,这是非常不同的。这始终是一个风险,为了减少这种风险,(对于一个基于云的非商业系统)关注为其维护做出贡献的团队或社区是很重要的。

你可以问以下问题:

这个群体有多大?

它看起来像在生长吗?

他们看起来投入了吗?

也许有一个治理模型?

这个系统是由实验室还是财团支持的?

他们有多坚定?

如果没有人给系统打补丁,而且它可能是开源的,我或我的团队能承担这个任务吗?

有很多用户吗?

您可以随时与您感兴趣的系统背后的人取得联系。

你是否遇到过很多来自图书管理员或图书馆的活动来支持这个工具领域的研究?

我们已经遇到了一些相当活跃的图书管理员,他们试图为这些工具开发研讨会和短期培训。会议的内容各不相同,从介绍到非常高级的工具使用,特别是如果工具可以帮助更深入地探索集合。在整个大学中,也有越来越多的人可能被认定为研究技术人员(一个类似于学习技术人员的角色,但专注于支持研究过程的研究工具和软件)。

这些都是在图书馆,或,或另一个研究支撑结构(如研究和创新部门)和非常熟悉的工具和培训运行,并且可以被称为建议,尤其是在研究数据管理工具和实时数据处理,数据分析和文本和数据挖掘。

我们也看到所有阶段的学生和学者(有时甚至跨越几个不同的部门,如社会科学与NLP小组)聚集在“工作组”中讨论、分享和相互学习不同工具的使用。

你是否了解过一个工具在提供如何使用它的信息方面做得有多好,或者它对用户有多友好?如果是的话,你觉得这些信息有用吗?是不是很普遍?

简短的回答是否定的,我们没有以更健壮的方式观察这些不同工具的用户友好性。

我可以说,当我测试了一些工具时,我会形成一个观点,即我是否容易导航和理解它们是做什么的,或者它们支持什么样的分析。这可能是我们要研究的下一个很好的领域。如果你正在开发一个软件,你想知道你提供的文档和信息的类型是否足够好,我会从软件可持续发展研究所指南,甚至让他们帮你做个评估

您是否遇到过在同时使用多个工具(多个生理工具、音频/视频记录等)时,用于同步或提供单个时间签名的工具?

我没有遇到过这样的工具,但我会保持我的眼睛。

有很多多语言工具吗?

是的,有多语言工具,尽管我现在没有足够的数据来量化它。例如,所有的音频转录工具都支持至少10种语言。文本挖掘工具,特别是那些欧洲以外的,覆盖的不仅仅是英语。

SPSS仍然被认为是社会科学和人文科学中最有效的统计软件包吗?

很难说。SPSS可能是社会科学中最常用的统计软件包之一,尽管R可能会取代它。在与数字人文主义者的几次对话中,他们提到R和越来越多的python正在本科和硕士阶段教授。Jamovi是一个用R做高级统计的非常整洁的界面,用一种更直观的方式。

在您看来,最好的免费调查工具是什么?哪些调查工具可以包含视频、图片和音乐?

这真的取决于您的用例。我喜欢Typeform,你可以使用它们的免费选项,包括一些图片。到目前为止,我的理解是,如果你需要更复杂的东西,比如整合音乐、播放和停止、视频、游戏和其他数字设计,你几乎总是需要付费版本。尽管经常与你的机构核实,他们可能已经订阅了一些这些调查,因为调查在许多学院使用。

颜色在调查工具幻灯片上的意义是什么?

其实没什么意义,只是提醒我该讲哪些。

有什么工具来分析图像,特别是美术研究?

这取决于你要分析多少张图片。对于定性研究,你仍然可以使用像NVIVO。如果你想在更大的范围内做一些事情,通过相似性来识别模式或聚类zegami。如果你技术熟练,你可以使用像这样的算法OpenPose;如果您只希望自动提取基本的元数据—您可以从这里开始clarifai,或者你可以用支持整个工作流程的工具构建自己的计算机视觉算法,比如Labelbox

当然,你也可以和牛津大学的视觉几何小组合作,他们也有一个图像分析的工具集

什么是最好的免费工具来捕捉一群人的实时投票,可能使用他们的个人手机或笔记本电脑?

这取决于你想要获得什么样的投票。不在列表中,但在我们的团队中,我们使用了一个基本的工具ideazboard。将想法和解决方案添加为“帖子”很容易,在需要的地方汇总它们,然后让人们对它们投票。

这也是值得检查的allourideas.org来自Matt Salganik和他的团队。这是一个改进版的调查工具,你既可以投票你的选择,也可以添加其他答案。

你知道有什么工具可以做田野记录(参与式观察法)吗?

Conseris例如,它是为不同的用例开发的,但是可以用于字段注释,特别是如果您希望以半结构化的方式收集这些字段注释。OpenDataKit非常棒,当您在难以到达的环境中收集数据时,它也是移动友好的,但不需要网络连接。

当然,您可以始终使用像Atlas.ti和NVIVO来组织和分析你的野外笔记,如果你能从你的笔记本电脑工作。一些研究人员也使用OneNote来自微软、Evernote(如果你想使用markdown)这对你写和组织笔记也很有用。

你有没有遇到专门为人类学(人种学)研究设计的工具?

是的,我们确实有。最常用的工具是NVIVO,Atlas.ti,Dedoose。有一种工具叫的Ethnograph,具有类似的特征。

有没有分析文章结构的工具?例如,告诉我一个段落的主要思想是什么,或者通过段落或段落对一篇文章进行情感分析?

有许多工具可以支持这些任务。到目前为止,我的理解是,你需要把你的文本按你想要分析的单位来分解。这里最容易使用的工具也是免费的橙色文本和数据挖掘这让您可以根据主题收集情感、模型和其他一些文本的基本统计分析。为了确定一段或一篇文档的中心思想,你可以使用像这样的总结工具Scholarcy

什么是最好的情感分析软件,最好等于最用户友好?

这取决于你想分析的文本的规模。Voyant工具非常容易使用,并提供浏览器内功能,作为一款应用,我会选择免费的橙色文本和数据挖掘。目前有各种各样的Twitter情感分析工具,其中大多数都是用户友好型的。

注释文本和定性分析的区别是什么?

定性分析是一套解释和理解广泛材料的方法;而文本注释是其中一种方法。在工具集群的上下文中,我使用这两个术语来指定特性能力。与注释工具相比,定性分析工具通常具有更多的特性,可以支持更大的研究过程,而注释工具只是用于注释文本,对于组织和映射材料并不真正有用。

你有没有考虑或遇到过任何专门用于分析历史资料的工具?

是的,最好的出发点是Pelagios它是一个研究历史遗址的研究者网络。他们还开发工具并参与合作项目。Recogito,一个注释工具,是由这个社区开发和支持的。虽然在使用历史资料时,你会提出不同的输出和问题,但在使用文本或其他数字化材料时,社会科学和人文学科的许多研究过程是非常相似的。如果您正在寻找一种工具来支持映射、分析图像或分析文本,我将基于任务而不是学科进行搜索,我相信您会找到适合的工具。

在没有使用软件工具进行分析的情况下,大约有多少比例的UGs或pg被允许分离?

这是一个非常好的问题,很难衡量。也许这不是一个要求,但我发现很难相信会有一个学生从来没有使用过软件来运行一些分析。每个人可能都至少在excel中做过一次数据透视表。

你是否建议使用扫描软件来扫描学校的纸张调查,以取代铅笔和纸张调查的数据输入?

这不是我们研究过的领域,但我可以看到这是多么乏味和浪费时间的任务。我记得我在美国学习的时候,这个过程是比较规范的。有些卡片看起来就像打孔卡,我们必须用一种特殊的铅笔在圆圈里上色。然后自动扫描并评分。如果你的调查不仅仅是多项选择题,那就需要一个不同的解决方案。

在Android智能手机上运行实验任务的最佳建议是什么?

有许多软件可以进行实验,但除非我错过了,否则我没有看到它们为手机提供足够好的用户体验。有一些工具可以记录或收集数据,就像在手机上运行的实时日志(比如MindLogger),但目前大多数实验都局限于大屏幕。给志愿者科学一个走。

你能告诉我们更多关于收集实验性行为数据(例如反应时间)的软件,以及基于调查或自我报告的研究或文本分析工具吗?

这是两种完全不同的方法,当然,取决于你选择做什么和什么最适合你的研究问题,你可以使用适当的软件。在某些情况下,你可以设置一个调查软件来测量完成率并从中推断出反应时间,但这太间接了,可能不会给你带来好的结果。对于大多数实验工具,您还可以包含一些调查问题并收集这类数据。

你们提供数据科学、数据挖掘等基础课程吗?

是的!看看圣人校园;我们为社会科学家提供的一系列在线数据科学课程。记住,在付款时使用TOOLS25代码可以获得25%的折扣。