
knime_quickstart.docx
19页knime 快速入门安装:下载软件,解压到指定目录中,单击 knime.exe 文件启动 KNIME欢迎界面/附加特色:首次 KNIME 启动后,出现欢迎屏幕,可看到:1、 打开 KNIME 工作台:打开 KNIME 工作台立即启动 KNIME,建立工作流,探索数据2、获得附加节点:除了准备启动基本 KNIME 安装,还有附加的 KNIME 插件(plug-ins) 如 R 和 Weka 集成,或附加的处理化学结构、化合物的化学工具包等等可下载这些特色也可从 KNIME 内部更新(文件,更新 KNIME……) 一、工作界面预览:KNIME 工作台如下图所示:二、操作步骤:1、建立工作流:Building a workflow将节点从节点资源库拖到工作流编辑器并连接它们来构建工作流 节点是工作流的基本处理单元每个节点具有多个输入和/或输出端口 数据(或模型)通过连接从输出端口传输到另一个节点的输入端口节点状态:Node Status当节点被拖动到工作流编辑器上时,状态指示灯显示红色,意味着必须配置节点以便能够执行 通过右键单击节点,选择“配置” ,然后在节点的对话框中调整必要的设置来配置节点。
当通过按下“确定”按钮关闭对话框时,将配置节点,并且状态指示灯变为黄色:节点已准备好执行 右键单击节点,再次显示启用的“执行”选项; 按下它将执行该节点,并且该节点的结果将在输出端口可用 成功执行后,节点的稳态灯为绿色可通过浏览输出端视图来检查结果:在上下文菜单中的最后一个条目打开它们端口左侧的端口是输入端口,提供来自前续节点的输出端口的数据 右边的端口是输出端口 节点对数据的操作结果在输出端口提供给后续节点 工具提示提供了有关节点输出的信息,更多信息可以在节点描述中找到节点被键入,使得仅可以连接相同类型的端口数据端口:最常见类型是从节点到节点传输平面数据表的数据端口(白色三角形) 数据库端口:在数据库中执行命令的节点可以由其数据库端口识别(棕色方块):PMML 端口:通过蓝色平方 PMML 端口,数据挖掘节点学习传递到参考预测器节点的模型 ,其它端口:每当节点提供不适合平面数据表结构的数据时,使用通用端口(深蓝色方形)用于结构化的数据 既不是数据、数据库、PMML 或结构化数据的端口的端口显示为“未知”类型(灰色方块) 示例流程现一步一步介绍构建一个简单小型工作流程:从 ASCII 文件读取数据,为其分配颜色,聚类数据,在表格和散点图中显示数据。
在执行流程后,将检查已经构建的数据模型 假设刚刚启动 KNIME 建立一个空的工作流添加节点(Adding Nodes):在节点资源库中,展开“IO” 和包含的“读取”类别,如下所示(左图) ,拖曳文件读取器图标到工作流编辑器窗口中现在下一个节点将是 K 均值聚类算法 展开挖掘类别,然后是聚类类别,然后将 K-Means 节点拖动到流(右图) 在节点资源库搜索框中输入“color” ,然后按“Enter” 这会将显示的节点限制为名称中带有“color”的节点(参见上图中间) 将颜色管理器节点拖到工作流上(此节点将稍后定义数据视图中的颜色) 再次查看存储库中的所有节点,请在节点资源库的搜索字段中按 ESC 或退格 现在将“交互表”和“散点图”从 “数据视图”类别拖动到“工作流程编辑器” ,并将其放置在“颜色管理器”节点的右侧连接节点(Connecting Nodes):现在需要连接节点以便获得数据流单击输出端口并将连接拖动到相应的输入端口 完成流程如下图所示:当然,节点不会显示绿色状态,只要它们没有配置和执行配置节点(Configuring Nodes):完全连接需要配置显示红色状态图标的节点。
从文件读取器开始,右键单击并从菜单中选择“配置” 浏览到 KNIME 安装目录中的“IrisDataSet”目录从此位置选择 data.all文件文件读取器的预览表显示了数据的样本按确定关闭文件读取器节点的对话框 一旦节点配置正确,它将切换到黄色(表示准备执行) 之后,K-Means 节点将立即变为黄色,因为将应用其默认设置可以确认默认设置符合您的需要,打开对话框并检查默认设置为了配置颜色管理器节点,您必须首先执行 K-Means 节点执行后,所有属性的所有标称值和范围都是已知的:此元信息传播到后续节点颜色管理器需要此数据才能进行配置 一旦执行 K-Means 节点,打开颜色管理器节点的配置对话框执行节点(Executing Nodes):现在执行散点图节点:工作台将为您执行所有前续节点 在更大、更复杂的流程中,您可以选择多个节点并触发所有节点的执行工作流管理器将根据需要执行节点,如果可能并行执行检查结果(Inspecting the Results):为了检查数据和结果,打开节点视图 在示例中,K 均值,交互式表和散点图有视图从节点突出显示中打开它们高亮标记(Hiliting):在散点图中选择一些点,然后从“高亮 Hilite”菜单中选择“高亮选择 Hilite Selected”。
被高亮的点用橙色边框标记 您还将在表视图中看到被高亮的点高亮状态的传播适用于显示相同数据流所有分支中的所有视图踏上你自己的探索之旅!现在这只是一个很简单开始的例子,还有很多值得探索的地方 玩吧!保持简单和直观很乐意收到您的反馈,找出您喜欢什么和您不喜欢什么;觉得尴尬的东西或似乎没有工作的东西KNIME 工作台指南(KNIME Workbench User Guide)可用视图说明(Description of Available Views)下文中详细地描述 KNIME 工作台及其特征当 KNIME 最初打开时,它从以下视图的排列开始:工作流项目(Workflow Projects):所有 KNIME 工作流均显示在“工作流项目”视图中工作流的状态指示工作流是关闭、空闲的、正在执行还是是否执行完成收藏节点(Favorite Nodes):“收藏节点”视图显示最喜欢、最常用和最后使用的节点 通过将节点从节点库拖动到个人收藏节点类别,可将节点添加到收藏夹 每当将节点拖动到工作流编辑器上时,将更新最后使用和最常用的类别收藏节点视图在视图的菜单栏中包含以下操作:折叠所有展开的类别展开所有类别清除最后使用和最常用的类别从收藏夹中删除所选节点最频繁和最后使用类别中的节点数量默认限制为十个节点。
此数可以在首选项中进行调整 选择“ File/Preferences..”/ KNIME / KNIME GUI 为常用节点的最大大小和最后使用的节点的最大数量设置不同的值节点资源库(Node Repository):节点存储库包含按类别排序的所有 KNIME 节点类别可以包含另一个类别,例如,“读取”类别是 IO 类别的子类别将节点拖曳到工作流编辑器中,可以将资源库中的节点添加到工作流编辑器选择类别显示节点描述视图中的所有包含的节点; 选择节点将显示此节点的帮助如果知道节点的名称,可在节点资源库的搜索框中输入名称的部分 在键入时,所有节点将立即过滤到包含其名称中输入的文本的节点:大纲(Outline):大纲视图提供了整个工作流的概览,即使工作流编辑器中有一小部分可见(在大纲视图中标记为灰色) 大纲视图可用于导航:灰色矩形可以用鼠标移动,导致编辑器滚动,使可见部分与灰色矩形匹配控制台(Console):控制台视图打印出错误和警告信息,便为您提供在引擎提示下发生的事情线索 相同的信息(具有调试 DEBUG 详细信息级别写入日志文件,位于{workspace} /metadata / knime / knime.log) 。
如果要更改详细程度(日志文件或控制台视图级别) ,请转到文件/首选项... / KNIME 用于日志文件的详细级别或文件/ 首选项... / KNIME / KNIME GUI 的控制台视图的详细级别可选择:调试:调试消息主要用于开发 不建议将其用于控制台视图,因为它会减慢 KNIME信息:记录信息消息 不是真的重要,但也不是完全无用!警告:如果节点配置失败,也会发出警告消息 警告消息不是致命的; 通常工作流可以继续执行,但它们表示已经发生了值得了解的事情 默认和建议级别控制台视图错误:仅在发生致命事件时发出,即工作流程无法再执行节点描述(Node Description):节点描述显示关于所选节点(或所选类别中包含节点)的信息 特别地,它解释了对话框选项、可用视图、预期输入数据和结果输出数据 Linux 下,此视图有一些问题,因为它需要系统的 Web 浏览器如果环境变量 MOZILLA_FIVE_HOME 未设置,KNIME / Eclipse 会尝试自动查找基于Mozilla 的浏览器 knime.sh 应该注意在这种情况下使用哪个浏览器可以尝试显式设置MOZILLA_FIVE_HOME 到 firefox 目录,如果这不能帮助你也可以尝试传递 “-Dorg.eclipse.swt.browser.XULRunnerPath = ...”到 knime.sh。
有一个已知的 Firefox 3(和xulrunner> = 1.9)的问题,除了使用旧版本,没有解决方法这也可能会导致一些麻烦另请参阅链接的 Eclipse 错误报告 https://bugs.eclipse.org/bugs/show_bug.cgi?id=236724为了提供全文搜索,节点描述也集成在 Eclipse 帮助中 从菜单中选择帮助/帮助内容以打开 Eclipse 内置帮助 有一个 KNIME 类别,它有一个节点描述子菜单 在搜索字段中,可以对所有节点描述执行全文搜索 例如,如果键入“ cluster”,将显示包含单词 cluster的所有节点描述:首选项(Preferences):首选项使用文件/首选项...打开KNIME 相关首选项分为三类:KNIME 首选项也可应用到 KNIME 批处理模式日志文件记录层级(Log file Log Level):日志文件的详细程度 默认值为 DEBUG,这意味着还会记录开发人员的信息 如果您遇到任何意外行为,则将此日志文件发送给我们可能会给我们提示导致该问题的原因所有节点的最大工作线程数(Maximum working threads for all nodes):KNIME 工作流管理器尝试优化所有节点的执行时间,例如,通过将工作流的单独分支分布到多个线程。
它可以归结为并行的运行节点尽可能 在这里你可以输入应该用于并行化的线程数 默认情况下,它是 CPU 数量的两倍 这已被证明是一个很好的数值临时文件目录(Directory for temporary files):KNIME 需要在某处存储一些临时文件(已执行但尚未保存的工作流的数据) 这是您可以指定位置的位置KNIME 图形用户界面(KNIME GUI):KNIME 图形用户界面相关首选项控制台视图日志级别(Console View Log Level):详细程度的日志消息控制台视图中显示 通常警告就够了 DEBUG 会降低性能,并且主要用于开发确认节点复位(Confirm Node Reset):在重置已执行的节点时选中或取消选中是否要弹出确认对话框 如果您在此类型的对话框中选中了“ 不要再询问”复选框,请转到首选项以使其重新出现确认节点/连接删除( Confirm Node/Connection Deletion):与上述相同,但用于确认删除节点和/或连接确认已连接的节点的重新连接(Confirm reconnection of already con。
