阅读以下说明和流程图,填补流程图中空缺,将解答填入答题纸对应栏内。
[说明]
指定网页中,某个关键词出现次数除以该网页长度称为该关键词在此网页中词频。对新闻类网页,存在一组公共关键词。因此,每个新闻网页都存在一组词频,称为该新闻网页特征向量。
设两个新闻网页特征向量分别为:甲(a1,a2,...,ak)、乙(b1,b2,...,bk),则计算这两个网页相似度时需要先计算它们内积S=a1b1+a2b2+...+akbk。一般情况下,新闻网页特征向量维数是巨大,但每个特征向量中非零元素却并不多。为了节省存储空间和计算时间,我们依次用特征向量中非零元素序号及相应词频值来简化特征向量。为此,我们用(NA(i),A(i)|i=1,2,...,m)和(NB(j),B(j)|j=1,2,...,n)来简化两个网页特征向量。其中:NA(i)从前到后描述了特征向量甲中非零元素A(i)序号(NA(1)<NA(2)<...),NB(j)从前到后描述了特征向量乙中非零元素B(j)序号(NB(1)<NB(2)<...)。
下面流程图描述了计算这两个特征向量内积S过程。
正确答案及解析
正确答案
解析
0
S+A(i)B(j) 或 等价表示
i>m或i=m+1或 等价表示
j>n或i=n+1 或 等价表示
i>m or j>n或i=m+1 or i=n+1 或等价表示
【解析】
本题是简化了一个大数据算法应用之例。世界上每天都有大量新闻网页,门户网站需要将其自动进行分类,并传送给搜索用户。为了分类,需要建立网页相似度衡量方法。流行算法是,先按统一关键词组计算各个关键词词频,形成网页特征向量,这样,两个网页特征向量夹角余弦(内积/两个向量模乘积),就可以衡量两个网页相似度。因此,计算两个网页特征向量内积就是分类计算中关键。
对于存在大量零元素稀疏向量来说,用题中所说简化表示方法是很有效。这样,求两个向量内积只需要在分别从左到右扫描两个简化向量时,计算对应序号相同(NA(i)=NB(j))时A(i)*B(j)之和(其他情况两个向量对应元素之乘积都是0)。因此,流程图中(2)处应填S+A(i)*B(j),而累计初始值S应该为0,即(1)处应填0。
流程图中,NA(i)<NB(j)时,下一步应再比较NA(i+1)<NB(j),除非i+1已经越界。因此,应先执行i+1→i,再判断是否i>m或i=m+1(如果成立,则扫描结束)。因此(3)处应填i>m或i=m+1。
流程图中,NA(i)>NB(j)时,下一步应再比较NA(i)<NB(j+1),除非j+1已经越界。因此,应先执行j+1→j,再判断是否j>n或j=n+1(如果成立,则扫描结束)。因此(4)处应填j>n或j=n+1。
(5)处应填扫描结束条件,i>m or j>13或i=m+1 or j=n+1,即两个简化向量之一扫描结束时,整个扫描就结束了。
你可能感兴趣的试题
试题一(共 20 分)阅读下列说明和图,回答问题 1 至问题 3,将解答填入答题纸对应栏内。【说明】设有二维整数数组(矩阵)A[1:m,1:n],其每行元素从左至右是递增,每列元素从上到下是递增。以下流程图旨在该矩阵中需找与给定整数 X 相等数。如果找不到则输出“false”;只要找到一个(可能有多个)就输出“True”以及该元素下标 i 和 j(注意数组元素下标从 1 开始)。例如,在如下矩阵中查找整数 8,则输出伟:True,4,12 4 6 94 5 9 106 7 10 128 9 11 13流程图中采用算法如下:从矩阵右上角元素开始,按照一定路线逐个取元素与给定整数 X 进行比较(必要时向左走一步或向下走一步取下一个元素),直到找到相等数或超出矩阵范围(找不到)。【流程图】
【问题】该算法时间复杂数是()
供选择答案:A.O(1) B.O(m+n) C.(m*n) D,O(m2+n2)
- 查看答案
阅读以下说明和流程图,填补流程图中空缺,将解答填入答题纸对应栏内。
[说明]
指定网页中,某个关键词出现次数除以该网页长度称为该关键词在此网页中词频。对新闻类网页,存在一组公共关键词。因此,每个新闻网页都存在一组词频,称为该新闻网页特征向量。
设两个新闻网页特征向量分别为:甲(a1,a2,...,ak)、乙(b1,b2,...,bk),则计算这两个网页相似度时需要先计算它们内积S=a1b1+a2b2+...+akbk。一般情况下,新闻网页特征向量维数是巨大,但每个特征向量中非零元素却并不多。为了节省存储空间和计算时间,我们依次用特征向量中非零元素序号及相应词频值来简化特征向量。为此,我们用(NA(i),A(i)|i=1,2,...,m)和(NB(j),B(j)|j=1,2,...,n)来简化两个网页特征向量。其中:NA(i)从前到后描述了特征向量甲中非零元素A(i)序号(NA(1)<NA(2)<...),NB(j)从前到后描述了特征向量乙中非零元素B(j)序号(NB(1)<NB(2)<...)。
下面流程图描述了计算这两个特征向量内积S过程。
- 查看答案
试题(15 分)阅读以下说明和流程图,填补流程图中空缺,将解答填入答题纸对应栏 内。【说明】设有整数数组 A[1:N](N>1),其元素有正有负。下面流程图在该数组 中寻找连续排列若干个元素,使其和达到最大值,并输出其起始下标 K、元素 个数 L 以及最大和值 M。例如,若数组元素依次为 3,-6,2,4,-2,3,-1,则输出 K=3,L=4,M=7。 该流程图中考察了 A[1:N]中所有从下标 i 到下标 j(j≥i)各元素之和 S,并动态地记录其最大值 M。【流程图】
注:循环开始框内应给出循环控制变量初值和终值,默认递增值为 1,格式为:循环控制变量=初值,终值
- 查看答案
阅读以下说明和流程图,填补流程图中空缺,将解答填入答题纸对应栏内。
[说明]
本流程图旨在统计一本电子书中各个关键词出现次数。假设已经对该书从头到尾依次分离出各个关键词{A(i)|i=1,…,n}(n>1)},其中包含了很多重复项,经下面流程处理后,从中挑选出所有不同关键词共m个{K(j)|j=1,…,m},而每个关键词K(j)出现次数为NK(j),j=1,…,m。
[流程图]
- 查看答案
阅读下列说明、C++代码和运行结果,填补代码中空缺,将解答填入答题纸对应栏内。
[说明]
对部分乐器进行建模,其类图如下图所示,包括:乐器(Instrument)、管乐器(Wind)、打击乐器(Percussion)、弦乐器(Stringed)、木管乐器(Woodwind)、铜管乐器(Brass)。
类图
下面是实现上述设计C++代码,其中音乐类(Music)使用各类乐器(Instrument)进行演奏和调音等操作。
using namespace std; enum Note(/*枚举各种音调*/ MIDDLE_C,C_SHARP,B_FLAT }; classInstrument{/*抽象基类,乐器*/ public: ______; //play函数接口 virtual voidadjust()=0; //adjust函数接口 }; class Wind ______{ public: void play(Note n) { cout<<"Wind.play() "<<n<<endl; } void adjust(){cout<<"Wind.adjust()"<<endl; } ); /*类Percussion和Stringed实现代码略*/ class Brass ______{ public: void play(Note n) {cout<<"Brass.play() "<<n<<endl; } void adjUSt(){cout<<"Brass.adjust()"<<endl;) }; classWoodwind:public Wind{ public: void play(Note n) { cout<<"Woodwind.play()"<<n<<endl; } }; class MusiC { public: voidtune(Instrument*i) { i->play(MIDDLE_C.; } voidadjust(Instrument*i){ i->adjust(); } void tuneAll(______ e[],int numIns){ /*为每个乐器定调*/ for(int i=0; i<numIns; i++){ this->tune(e[i]); this->adjust(e[i]); } } }; /*使用模板定义一个函数size,该函数将返回数组array元素个数,实现代码略*/ int main(){ Music*music=______ Music(); Instrument*orchestra[]={new Wind(),new Woodwind() }; music->tuneAll(orchestra,size(orchestra));/*size返回数组orchestra元素个数*/ for(int i=0;i<size(orchestra);i++) deleteorchestra[i]; delete music; }
本程序运行后输出结果为:
Wind.play()0 Wind.adjust() Woodwind.play()0 Wind.adjust()
- 查看答案