Carolina Colorado
Test por , creado hace más de 1 año

modulo 2 Big Data

61
2
0
Carolina Colorado
Creado por Carolina Colorado hace más de 7 años
Cerrar

P1-Modulo 2 : Big data analysis y technology concepts

Pregunta 1 de 200

1

Big data analysis differs from trditional data analysis primary because

Selecciona una de las siguientes respuestas posibles:

  • volume, value and varirety

  • volume, velocity and variety

  • veracity, volume and velocity

Explicación

Pregunta 2 de 200

1

In big data analysis and analytics, a fundamental step-by-step process is needed to organize the task involved

Selecciona una de las siguientes respuestas posibles:

  • retrieving, processing, producing and visualization data

  • retrieving, processing, producing and repurposing data

  • retrieving, processing, organize and repurposing data

Explicación

Pregunta 3 de 200

1

which are 1,2 and 3 stages of bigData analysis lifecycle

Selecciona una de las siguientes respuestas posibles:

  • Data analysis, data identification and ata extraction

  • bussines cased evaluation, data extraction and data analysis

  • bussines case evaluation, data identificaction and data acquisition and filtering

Explicación

Pregunta 4 de 200

1

which are 4,5 and 6 stages of bigData analysis lifecycle

Selecciona una de las siguientes respuestas posibles:

  • data analysis, data visualization & utilization of analysis results

  • data extraction, data validation & cleansing and data aggregation & representation

  • data extraction, data aggregation & representation

Explicación

Pregunta 5 de 200

1

which are 7,8 and 9 stages of bigData analysis lifecycle

Selecciona una de las siguientes respuestas posibles:

  • data analysis, data visualization and utilization of analysis results

  • data aggregation & represntation, data analyisis and data visualization

  • data identifcation, data acquisition & filtering and data extraction

Explicación

Pregunta 6 de 200

1

The business case evaluation stage requires that a business case be ________, __________ and ______________ prior to proceeding with the actual hands-on analysis tasks.

Selecciona una de las siguientes respuestas posibles:

  • organized, created and approbed

  • created, assessed and approbed

  • created, organized and analyzed

Explicación

Pregunta 7 de 200

1

An evaluation of a Big Data analysis bussines case helps decision-makers undertand

Selecciona una de las siguientes respuestas posibles:

  • the business resources that will need to be utilized and wich bussines challenges the analysis

  • the data that will need to be utilized and wich bussines challenges the analysis

  • the business resources that will need to be utilized and wich bussines objectives the analysis

Explicación

Pregunta 8 de 200

1

The KPIs is ussefull in Business Case Evaluation

Selecciona una de las siguientes respuestas posibles:

  • true

  • false

Explicación

Pregunta 9 de 200

1

based on the business requirements documented in the _______________________________ , it can be determined whether the business problems being addresed are really Big data problems

Selecciona una de las siguientes respuestas posibles:

  • use case

  • business case

  • requirements case

Explicación

Pregunta 10 de 200

1

a bussines problem needs to be directly related to one or more of the big data characteristics

Selecciona una de las siguientes respuestas posibles:

  • veracity, velocity or variety

  • value, velocity or variety

  • volume, velocity or variety

Explicación

Pregunta 11 de 200

1

Another outcome in Business case evaluation is

Selecciona una de las siguientes respuestas posibles:

  • determination of budget required to carry out the analysis project

  • determination of data required to carry out the analysis project

  • determination of resources required to carry out the analysis project

Explicación

Pregunta 12 de 200

1

The invesment can be weighed against the expected benefits of achieving the goals

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 13 de 200

1

Initial iterations of the big data analysis lifecycle will not required more up-front invesment of Big Data tecnologies, products and training compared to later iterations

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 14 de 200

1

The data identification stage is dedicated to identifiying the _____________ required for the analysis project

Selecciona una de las siguientes respuestas posibles:

  • metadata

  • datasets

  • datamart

Explicación

Pregunta 15 de 200

1

identifying a wider variety of data sources may increase the probability of finding

Selecciona una de las siguientes respuestas posibles:

  • hidden patterns and aggregations

  • hidden patterns and correlations

  • hidden resources and datasets

Explicación

Pregunta 16 de 200

1

Can be beneficial to identify as many types of releated data sources and insights as possible, especilly when we don´t know exactly what we're looking for.

Selecciona una de las siguientes respuestas posibles:

  • TRUE

  • FALSE

Explicación

Pregunta 17 de 200

1

Depending on the business scope of analysis project and nature of business problems being adressed, the required dataset and their sourcescan be

Selecciona una de las siguientes respuestas posibles:

  • structured and not structured

  • big or small of all enterprise

  • internal or external to enterprise

Explicación

Pregunta 18 de 200

1

Internal dataset

Selecciona una de las siguientes respuestas posibles:

  • data markets and publicly avalaible datasets

  • internal sources, such as data marts and operational system

  • embedded within blogs or other types of content-based websites

Explicación

Pregunta 19 de 200

1

external datasets

Selecciona una de las siguientes respuestas posibles:

  • strudtured data, unstructured data

  • data marts and operational systems

  • Case they may need to be harvested via automated tools

Explicación

Pregunta 20 de 200

1

data is gathered from all of data sources that were identified during the previous stage, and is then subjected to the automated filtering of corrupt data or data that has been deemed to have no value to the analysis obvjectives

Selecciona una de las siguientes respuestas posibles:

  • Data identification

  • data acquisition & filtering

  • Data aggregation & representation

Explicación

Pregunta 21 de 200

1

Depending on the type of data source , data may come as a dump of files or may require API integration

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 22 de 200

1

in many cases , especially where external, unstructured data is concerned, some or most of the acquired data may be irrelevant (noise) and can be discarded as part of the filtering process

Selecciona una de las siguientes respuestas posibles:

  • Data acquisition & filtering

  • Data extraction

  • Data validation & cleansing

Explicación

Pregunta 23 de 200

1

data classified as "corrupt" can include records with missing or nonsensical values or invalid data type

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 24 de 200

1

Data thah is filtered out for one analysis may not be valueable for a different type of analysis

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 25 de 200

1

it is advisable to store a verbatim copy of the original dataset proceeding with the filtering.

Selecciona una de las siguientes respuestas posibles:

  • To save on required storage space, the verbatim copy is compressed after storage

  • To save on required storage space, the verbatim copy is compressed before storage

  • To save on required storage space, the verbatim copy is compressed in the same time of storage

Explicación

Pregunta 26 de 200

1

to be persisted once it gets generated or enters the enterprise boundary

Selecciona una de las siguientes respuestas posibles:

  • internal data

  • internal and external data

  • external data

Explicación

Pregunta 27 de 200

1

The data is persisted to disk prior to analysis

Selecciona una de las siguientes respuestas posibles:

  • realtime analytics

  • Batch anlytics

  • realtime analytics and batch analytics

Explicación

Pregunta 28 de 200

1

The data is analyzed first and then persisted to disk

Selecciona una de las siguientes respuestas posibles:

  • realtime analytics

  • batch analytics

  • realtime analytics and batch analytics

Explicación

Pregunta 29 de 200

1

Can be added via automation to data from both internal and external data sources to improve the classification an querying

Selecciona una de las siguientes respuestas posibles:

  • info data

  • data analysis

  • metadata

Explicación

Pregunta 30 de 200

1

Metadata example can include

Selecciona una de las siguientes respuestas posibles:

  • datamart size and structure, source information, date and time of creation or collection, language-specific information etc.

  • database size and structure, source information, date and time of creation or collection, language-specific information etc.

  • dataset size and structure, source information, date and time of creation or collection, language-specific information etc.

Explicación

Pregunta 31 de 200

1

it is vital that metadata be machine-readable and passed forward along subsequent analysis stages

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 32 de 200

1

This helps to maintain data provenance throughout the Big Data analysis lifecycle, wich helps establish and preserve data accuracy and quality

Selecciona una de las siguientes respuestas posibles:

  • metadata

  • source information

  • date and time of creation or collection

Explicación

Pregunta 33 de 200

1

Some of the data identified as input for the analysis may arrive in a format incompatible with the big data solution

Selecciona una de las siguientes respuestas posibles:

  • true

  • false

Explicación

Pregunta 34 de 200

1

the need to address disparate types of data is more likely with data from

Selecciona una de las siguientes respuestas posibles:

  • internal sources

  • external sources

Explicación

Pregunta 35 de 200

1

is dedicated to extracting disparate data and transforming it into a format that the underliying Big Data solution can use for the purpose of the data analysis

Selecciona una de las siguientes respuestas posibles:

  • Data acquisition & filtering

  • data validation & cleansing

  • data extraction

Explicación

Pregunta 36 de 200

1

The extent of extraction and transformation required depends

Selecciona una de las siguientes respuestas posibles:

  • on the types of analytics and capabilities of the Big Data solution

  • bussines case

  • Data extraction

Explicación

Pregunta 37 de 200

1

Estracting the required fields from delimited textual data (such as with web server log files) may not be necessary

Selecciona una de las siguientes respuestas posibles:

  • capabilities of the Big Data Solution

  • underlying Big Data solution can already directly process those files

  • transforming it into a format that underlying Big Data solution

Explicación

Pregunta 38 de 200

1

example of document that not need further transformation

Selecciona una de las siguientes respuestas posibles:

  • XML and JSON

  • facebook and twitter

  • image and video

Explicación

Pregunta 39 de 200

1

The invalid data can

Selecciona una de las siguientes respuestas posibles:

  • Skew an falsify analysis results

  • Lose business objectives

  • Lose the accuracy of the analysis

Explicación

Pregunta 40 de 200

1

data input into Big Data analyses can be unstructured without any indication of validity

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 41 de 200

1

the complexity can further make it easy to arrive at a set of suitable validation constraint

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 42 de 200

1

Is dedicated to establishing (often complex) validation rules and removing any know invalid data

Selecciona una de las siguientes respuestas posibles:

  • Data acquisition and filtering

  • Data validation and cleansing

  • Data identification

Explicación

Pregunta 43 de 200

1

Big Data solutions often receive redundant data across different datasets, this redundancy can be exploited to explore interconnected datasets in order to assemble validation parameters and fill in missing valid data

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 44 de 200

1

For Batch analytics, data validation and cleansing can be achieved via offline

Selecciona una de las siguientes respuestas posibles:

  • data minnig

  • ELT operation

  • ETL operation

Explicación

Pregunta 45 de 200

1

Data input in Big Data can be unstructured without any indication of validity

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 46 de 200

1

provenance can play an important role in determining the accuracy and quality of questionable data

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 47 de 200

1

data that appears to be invalid may still be valuable in that it may posses

Selecciona una de las siguientes respuestas posibles:

  • most important data

  • hidden patterns an trends

  • noise

Explicación

Pregunta 48 de 200

1

Data may be spread across multiple datasets, requiring that datasets be joined together via common files (date or ID)

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 49 de 200

1

either way a method of data ________________ is required or the dataset representing ther correct value needs to be determined

Selecciona una de las siguientes respuestas posibles:

  • aggregation

  • reconciliaton

  • representation

Explicación

Pregunta 50 de 200

1

Dedicated to integrating multiple datasets together to arrive at a unified view

Selecciona una de las siguientes respuestas posibles:

  • Data aggregation & representation

  • Data extraction

  • Data visualization

Explicación

Pregunta 51 de 200

1

Can become complicated because od differences in : although the data format may be the same, the data model may be different

Selecciona una de las siguientes respuestas posibles:

  • semantics

  • BD engine

  • Data structure

Explicación

Pregunta 52 de 200

1

Can become complicated because od differences in : A valuethat is labelled differently in two different datasets may mean the same thing (surname and last name)

Selecciona una de las siguientes respuestas posibles:

  • BD engine

  • Semantics

  • Data structure

Explicación

Pregunta 53 de 200

1

In data Aggregation & Representation reconciling the differences can required complex logic that is executed ___________________.

Selecciona una de las siguientes respuestas posibles:

  • ETL process

  • human intervention

  • automatically

Explicación

Pregunta 54 de 200

1

Future data analysis requirements need to be considered during the stage ___________________ to help foster data reusability

Selecciona una de las siguientes respuestas posibles:

  • Data extraction

  • Data aggregation & REpresentation

  • Data validation and cleansing

Explicación

Pregunta 55 de 200

1

whether ___________________ is required or not, it is important to understand that the same data can be stored in many different forms. One form may be better suited for a particular type of analysis than another

Selecciona una de las siguientes respuestas posibles:

  • data cleansing

  • data aggregation

  • filtering

Explicación

Pregunta 56 de 200

1

A data structured standarized by the Big Data solution can require establishing a central, standard analysis repository, such as a

Selecciona una de las siguientes respuestas posibles:

  • untructured database

  • structured database

  • NoSQL database

Explicación

Pregunta 57 de 200

1

the data analysis stage is dedicated to carriying out the actual analysis task, which typically involves one or more types of analytics

Selecciona una de las siguientes respuestas posibles:

  • data validation %cleansing

  • Data Analysis

  • Utilization os analysis results

Explicación

Pregunta 58 de 200

1

This stage can be iterative in nature, because repeated until appropiated pattern or correlation is uncovered

Selecciona una de las siguientes respuestas posibles:

  • data aggregation & representation

  • Data analysis

  • Data extraction

Explicación

Pregunta 59 de 200

1

The approach taken when carrying out this stage, data analysis, an be classified as ______________________________

Selecciona una de las siguientes respuestas posibles:

  • acquisition analysis and filtering analysis

  • confirmatory analysis and exploratory analysis

  • validation analysis and cleansing

Explicación

Pregunta 60 de 200

1

___________________________ adata analysis is a deductive approach where the cause of the phenomenon being investigated is proposed beforehand

Selecciona una de las siguientes respuestas posibles:

  • Confirmatory analysis

  • Exploratory analysis

  • Data analysis

Explicación

Pregunta 61 de 200

1

the proposed cause or assumption is called a

Selecciona una de las siguientes respuestas posibles:

  • pattern and trend

  • deductive approach

  • hypotesis

Explicación

Pregunta 62 de 200

1

data samples are tipically used

Selecciona una de las siguientes respuestas posibles:

  • exploraty analysis

  • confirmatory analysis

Explicación

Pregunta 63 de 200

1

unexpected findings or anomalies are usually ignored since a predetermined cause was assumed

Selecciona una de las siguientes respuestas posibles:

  • true

  • false

Explicación

Pregunta 64 de 200

1

is an inductive approach that is closely associated to data mining

Selecciona una de las siguientes respuestas posibles:

  • exploratory data analysis

  • confirmatory data analysis

  • correlation analysis

Explicación

Pregunta 65 de 200

1

this analysis provides a general direction that can facilitate the discovery of patterns or annomalies

Selecciona una de las siguientes respuestas posibles:

  • confirmation analysis

  • Exploratory analysis

Explicación

Pregunta 66 de 200

1

Large amounts of data and visual analysis are typically used

Selecciona una de las siguientes respuestas posibles:

  • Confirmatory analysis

  • Exploratory analysis

Explicación

Pregunta 67 de 200

1

is dedicated to using _____________________ techniques and tools to graphically communicate the analysis results for effective interpretation by bussines users

Selecciona una de las siguientes respuestas posibles:

  • Data analysis

  • Data visualization

  • Utiolization of analysis results

Explicación

Pregunta 68 de 200

1

Bussines users needs to be able to understand the results in order to obtain value from analysis and subsequently have de ability to provide feedback from_______________ back to stage __________________

Selecciona una de las siguientes respuestas posibles:

  • Data validation and cleaning, data extraction

  • Data analysis, data aggregation & representation

  • Data visualization, Data analysis

Explicación

Pregunta 69 de 200

1

the same results may be presented ina a number a number of different ways.

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 70 de 200

1

another aspect to keep in mind is that providing a method of drilling down to comparatively simple statistics is crucial, in order for users to understand how to statistics were generated

Selecciona una de las siguientes respuestas posibles:

  • true

  • false

Explicación

Pregunta 71 de 200

1

support businessdecission-making, there may be further opportunieties to utilize the analysis results

Selecciona una de las siguientes respuestas posibles:

  • Utilization of analysis results

  • Data visualization

  • Data analysis

Explicación

Pregunta 72 de 200

1

The utilization os analysis results is dedicated to determining how and where processed analysis data can be further leveraged

Selecciona una de las siguientes respuestas posibles:

  • Utilization of analysis results

  • Data visualization

  • Data analysis

Explicación

Pregunta 73 de 200

1

"models" that encapsulated new insights and understandings about the nature of the patterns and realationships that exist within data that was just analyzed

Selecciona una de las siguientes respuestas posibles:

  • utilization of analysis results

  • Data analysis

  • Data validation &cleansing

Explicación

Pregunta 74 de 200

1

A "model" may look like a

Selecciona una de las siguientes respuestas posibles:

  • mathematical equation or a set of rules

  • structred database

  • the differents datasets

Explicación

Pregunta 75 de 200

1

Models can be used to improved bussines process logic

Selecciona una o más de las siguientes respuestas posibles:

  • new dataset

  • form the basis of a new system or software program

  • application system logic

  • new bussines case

Explicación

Pregunta 76 de 200

1

the data analysis results may be automatically or manually fed directly into enterprise systems to enhace and optimize their behavior and performance

Selecciona una de las siguientes respuestas posibles:

  • input for enterprise systems

  • Bussines process optimization

  • Alerts

Explicación

Pregunta 77 de 200

1

The identiffied patterns correlations and anomalies discovered during the data analysis are used to refine business process

Selecciona una de las siguientes respuestas posibles:

  • input for enterprise input

  • alerts

  • Bussines process optimization

Explicación

Pregunta 78 de 200

1

Data analysis results can be used as input for existing events that requires them to take corrective action

Selecciona una de las siguientes respuestas posibles:

  • input for enterprise input

  • business process optimization

  • alerts

Explicación

Pregunta 79 de 200

1

Big data nalysis concepts

Selecciona una o más de las siguientes respuestas posibles:

  • statical

  • aggregation

  • visual

  • machine learning

  • Semantic

  • Topic mapping

  • feelings

Explicación

Pregunta 80 de 200

1

statistical analysis

Selecciona una o más de las siguientes respuestas posibles:

  • A/B Testing

  • heat maps

  • correlation

  • Regression

  • filtering

Explicación

Pregunta 81 de 200

1

visual Analysis

Selecciona una o más de las siguientes respuestas posibles:

  • heat maps

  • outlier detection

  • time series analysis

  • Spatial Data Analysis

  • Network analysis

Explicación

Pregunta 82 de 200

1

machine learning

Selecciona una o más de las siguientes respuestas posibles:

  • correlation

  • clasification

  • clustering

  • outlier detection

  • filtering

  • regression

Explicación

Pregunta 83 de 200

1

semantic analysis

Selecciona una o más de las siguientes respuestas posibles:

  • classification

  • network analysis

  • Natural language processing

  • text analytics

  • sentiment analysis

Explicación

Pregunta 84 de 200

1

use statistical methods based on mathematical formulas as means for analizing data

Selecciona una de las siguientes respuestas posibles:

  • visual analysis

  • statistical analysis

  • machine learning

Explicación

Pregunta 85 de 200

1

it can also be used to infer patterns ans relationships within the dataset, such as regression and correlation

Selecciona una de las siguientes respuestas posibles:

  • statistical analysis

  • semantic analysis

  • analysis topic mapping

Explicación

Pregunta 86 de 200

1

also know as split or bucket testing, compares two versions of an element to determine wich version is superior based on a predefined metric

Selecciona una de las siguientes respuestas posibles:

  • correlation

  • A/B testing

  • regression

Explicación

Pregunta 87 de 200

1

A/B testing: the current version of the element is called the ______________ version, whereas the modified version is called the ____________

Selecciona una de las siguientes respuestas posibles:

  • official, non official

  • control,reatment

  • principal, copy

Explicación

Pregunta 88 de 200

1

both version, are subjected to an experiment simultaneously. The observationsare recorded to determine wich version is more sccessful

Selecciona una de las siguientes respuestas posibles:

  • correlation

  • Regression

  • A/B testing

Explicación

Pregunta 89 de 200

1

Athough ________________________can be implemented in almost domain, it is most often used in marketing

Selecciona una de las siguientes respuestas posibles:

  • A/B Testing

  • Regression

  • Correlation

Explicación

Pregunta 90 de 200

1

Generally, the objective is to gauge human behavior with the goal of increasing sales (as per the example below)

Selecciona una de las siguientes respuestas posibles:

  • Regression

  • A/B testing

  • Correlation

Explicación

Pregunta 91 de 200

1

is the new version of a drug better than the old one?

Selecciona una de las siguientes respuestas posibles:

  • correlation

  • Regression

  • A/B testin

Explicación

Pregunta 92 de 200

1

is an analysis tecnique used to determine whether two variables are related to each other

Selecciona una de las siguientes respuestas posibles:

  • Regression

  • Correlation

  • A/B testing

Explicación

Pregunta 93 de 200

1

an example of a relationship between two variables:
The value of variable A increases whenever the value of variable B increases

Selecciona una de las siguientes respuestas posibles:

  • Regression

  • A/B testing

  • Correlation

Explicación

Pregunta 94 de 200

1

Helps to develop an understanding of a dataset and find relationships that can assist in explaining a phenomenon

Selecciona una de las siguientes respuestas posibles:

  • Correlation

  • Regression

  • A/B testing

Explicación

Pregunta 95 de 200

1

commonly used for data mining where the identification between variables in a dataset leads to the discovery of patterns ans anomalies

Selecciona una de las siguientes respuestas posibles:

  • regression

  • correlation

  • A/B testing

Explicación

Pregunta 96 de 200

1

When two variables are considered to be correlated they are considered to be aligned based on a linear relationship

Selecciona una de las siguientes respuestas posibles:

  • false

  • true

Explicación

Pregunta 97 de 200

1

This mean that when one variable changes, the other variable also changes proportionally and constantly

Selecciona una de las siguientes respuestas posibles:

  • A/B testing

  • regression

  • correlation

Explicación

Pregunta 98 de 200

1

______________________ is expresed a a decimal number between -1 to 1, which is know as the correlation coeficient

Selecciona una de las siguientes respuestas posibles:

  • Correlation

  • Regression

  • A/B testing

Explicación

Pregunta 99 de 200

1

Correlation +1

Selecciona una de las siguientes respuestas posibles:

  • Suggest that there is a strong positive relationship between the two variables

  • suggests that there is no relationship at between two variables

  • Suggest that there is a strong negative relationship between the two variables (hipotesis)

Explicación

Pregunta 100 de 200

1

0 Correlation

Selecciona una de las siguientes respuestas posibles:

  • Suggest that there is a strong positive relationship between the two variables

  • suggests that there is no relationship at between two variables

  • Suggest that there is a strong negative relationship between the two variables (hipotesis)

Explicación

Pregunta 101 de 200

1

-1 Correlation

Selecciona una de las siguientes respuestas posibles:

  • Suggest that there is a strong negative relationship between the two variables (hipotesis)

  • suggests that there is no relationship at between two variables

  • Suggest that there is a strong positive relationship between the two variables

Explicación

Pregunta 102 de 200

1

sample: "Do students who perform well at elementary school perform equally well at high school"

Selecciona una de las siguientes respuestas posibles:

  • regression

  • Correlation

  • A/B testin

Explicación

Pregunta 103 de 200

1

explores how a dependent variable is related to an independent variable within a dataset

Selecciona una de las siguientes respuestas posibles:

  • Correlation

  • Regression

  • A/B Testing

Explicación

Pregunta 104 de 200

1

Helpss determine how the value od dependent variable changes in relation to changes in the value of the independent varible

Selecciona una de las siguientes respuestas posibles:

  • Correlation

  • Regression

  • A/B testing

Explicación

Pregunta 105 de 200

1

what the analysts discover is that 15% of additional stock in required for enery 5-degree increase in temperature

Selecciona una de las siguientes respuestas posibles:

  • regression

  • correlation

  • A/b testing

Explicación

Pregunta 106 de 200

1

more than one independent variable can be tested at the same time

Selecciona una de las siguientes respuestas posibles:

  • A/B testing

  • Regression

  • correlation

Explicación

Pregunta 107 de 200

1

in such cases only one independent variable may change. The others are kept constants

Selecciona una de las siguientes respuestas posibles:

  • A/B testing

  • Correlation

  • Regression

Explicación

Pregunta 108 de 200

1

can help enable a better understanding of what a phenomenin is and why it ocurred

Selecciona una de las siguientes respuestas posibles:

  • Correlation

  • Regression

  • A/B testing

Explicación

Pregunta 109 de 200

1

represents a constant rate of change

Selecciona una de las siguientes respuestas posibles:

  • linear regression

  • Non-linear regression

Explicación

Pregunta 110 de 200

1

Represents the variable rate of change

Selecciona una de las siguientes respuestas posibles:

  • linear regression

  • non-linear regression

Explicación

Pregunta 111 de 200

1

what will be the grades of a student studying at a high school based on her primary school grades

Selecciona una de las siguientes respuestas posibles:

  • correlation

  • regression

  • A/B testing

Explicación

Pregunta 112 de 200

1

_________________does not imply a causation. The change in the value of one variable may not be responsible for the change in the value of the second variable. although both may change at the same rate

Selecciona una de las siguientes respuestas posibles:

  • A/B testing

  • correlation

  • Regression

Explicación

Pregunta 113 de 200

1

assumes that both variables are independent

Selecciona una de las siguientes respuestas posibles:

  • Regression

  • correlation

  • A/B testing

Explicación

Pregunta 114 de 200

1

Deals with already identified dependent and independent variables

Selecciona una de las siguientes respuestas posibles:

  • Correlation

  • Regression

  • A/B Testing

Explicación

Pregunta 115 de 200

1

_________________ can be applied to further explore the relationship and predict the values of the dependent variable, based on the know values of the independent variable

Selecciona una de las siguientes respuestas posibles:

  • correlation

  • Regression

  • A/B testing

Explicación

Pregunta 116 de 200

1

is a form of data analysis that involves the graphic representation of data to enable or enhace its visual perception

Selecciona una de las siguientes respuestas posibles:

  • statistical analysis

  • visual analysis

  • semantic analysis

Explicación

Pregunta 117 de 200

1

develop a deeper understanding of the data being analyzed. Specifically, it helps identify and highlight hidden patterns, correlations and anomalies.

Selecciona una de las siguientes respuestas posibles:

  • statistical analysis

  • visual analysis

  • semantic analysis

Explicación

Pregunta 118 de 200

1

visual analysis

Selecciona una o más de las siguientes respuestas posibles:

  • Heat maps

  • time series analysis

  • outlier detectition

  • network analysis

  • spatial data analysis

Explicación

Pregunta 119 de 200

1

Are an effective visual analysis technique for expressing patterns, data compositions via part-whole relations and geographic distribution of data

Selecciona una de las siguientes respuestas posibles:

  • time series analysis

  • heat maps

  • spatial data analysis

Explicación

Pregunta 120 de 200

1

They also facilitate the identification of areas of interest ans the discovery of extreme (high/low) values wihin a dataset

Selecciona una de las siguientes respuestas posibles:

  • Network analysis

  • heat maps

  • spatial data analysis

Explicación

Pregunta 121 de 200

1

___________ itself is a visual, color-coded representation of data values

Selecciona una de las siguientes respuestas posibles:

  • network analysis

  • heat-maps

  • spatial data analysis

  • time series analysis

Explicación

Pregunta 122 de 200

1

A _______________ can be in the form of a chart or a map, as shown in the following pages

Selecciona una de las siguientes respuestas posibles:

  • heat maps

  • time series analysis

  • network analysis

  • spatial data analysis

Explicación

Pregunta 123 de 200

1

A___________ represents a matrix of values in which each cell is color-coded according to the value

Selecciona una de las siguientes respuestas posibles:

  • chart

  • map

Explicación

Pregunta 124 de 200

1

A ___________ represents a geographic measure by wich different regions are color-code according to certain theme

Selecciona una de las siguientes respuestas posibles:

  • chart

  • map

Explicación

Pregunta 125 de 200

1

How can i visually identify any patterns related to carbon emission across a large number of cities around the world

Selecciona una de las siguientes respuestas posibles:

  • Heat maps

  • time series analysis

  • network analysis

  • spatial data analysis

Explicación

Pregunta 126 de 200

1

____________is the analysis of data that is recorded over periodic intervals of time

Selecciona una de las siguientes respuestas posibles:

  • heat maps

  • time series analysis

  • network analysis

  • spatial data analysis

Explicación

Pregunta 127 de 200

1

Helps to uncover patterns within data that are time-dependent. Once identified, the patterns can be axtrapollated for future predictions

Selecciona una de las siguientes respuestas posibles:

  • heat maps

  • time series analysis

  • network analysis

  • spatial data analysis

Explicación

Pregunta 128 de 200

1

time series analyses are usually used for forecasting by identifiying long-term trends. seasonal periodic patterns and irregular short-term variations in the dataset

Selecciona una de las siguientes respuestas posibles:

  • time series analysis

  • heat map

  • network analysis

  • spatial data analysis

Explicación

Pregunta 129 de 200

1

always includes time as a comparision variable

Selecciona una de las siguientes respuestas posibles:

  • network analysis

  • heat maps

  • time series analysis

  • spatial data analysis

Explicación

Pregunta 130 de 200

1

is generally expressed using a line chart, with time plotted on the x-axis and the recorded data values plotted on the y-axis

Selecciona una de las siguientes respuestas posibles:

  • time series analysis

  • heat map

  • network analysis

  • spatial data analysis

Explicación

Pregunta 131 de 200

1

how much yield should the farmer expect based on historical yield data

Selecciona una de las siguientes respuestas posibles:

  • network analysis

  • spatial data analysis

  • heat maps

  • time series analysis

Explicación

Pregunta 132 de 200

1

is an interconected collection of entities

Selecciona una de las siguientes respuestas posibles:

  • heat maps

  • time series analysis

  • network analysis

  • spatial data analysis

Explicación

Pregunta 133 de 200

1

An entity can be a person a group or some other business domain object such as a product

Selecciona una de las siguientes respuestas posibles:

  • spatial data analysis

  • heat maps

  • time series analysis

  • network analysis

Explicación

Pregunta 134 de 200

1

some conectios may only be one-way, so that transversal in the reverse direction is nor possible

Selecciona una de las siguientes respuestas posibles:

  • true

  • false

Explicación

Pregunta 135 de 200

1

is a techniquethat focuses on analizing relationships between entities within the network

Selecciona una de las siguientes respuestas posibles:

  • time series analysis

  • heat maps

  • network analysis

  • spatial Data analysis

Explicación

Pregunta 136 de 200

1

There are specialized variations of network analysis

Selecciona una o más de las siguientes respuestas posibles:

  • Graphs

  • route optimization

  • social network analysis

  • spread predictions

Explicación

Pregunta 137 de 200

1

is used to find the shortest routes between the central warehouse and remote stores in order to minimize the durations of deliveries

Selecciona una de las siguientes respuestas posibles:

  • heat map

  • network analysis

  • spatial data analysis

  • time series analysis

Explicación

Pregunta 138 de 200

1

How can identify interaction patterns among a very large number of protein-to-protein interactiona?

Selecciona una de las siguientes respuestas posibles:

  • spatial data analysis

  • network analysis

  • heat maps

  • time series analysis

Explicación

Pregunta 139 de 200

1

is focused on analizing location-based data in order to find different geographic relationships and patterns between entities

Selecciona una de las siguientes respuestas posibles:

  • network analysis

  • spatial data analysis

  • time series analysis

  • Heat maps

Explicación

Pregunta 140 de 200

1

____________________________ is manipulated through a geographical information system (Gis) that plots spatial data on a map generally using its longitude and latitude coordinates

Selecciona una de las siguientes respuestas posibles:

  • Spatial data

  • structured data

  • unstructured data

Explicación

Pregunta 141 de 200

1

no two stores can be within a distance of 5 kilometers of each other to prevent the stores from competing with each other.

Selecciona una de las siguientes respuestas posibles:

  • time series analysis

  • network analysis

  • heat map

  • spatial data analysis

Explicación

Pregunta 142 de 200

1

how far do customers have to commute in order to get to a supermartket?

Selecciona una de las siguientes respuestas posibles:

  • spatial data analysis

  • heat maps

  • time series analysis

  • network analysis

Explicación

Pregunta 143 de 200

1

if the human knowledge can be combined with the processing speed of machines, machines will be able to process large amounts of data without requiring much human intervention

Selecciona una de las siguientes respuestas posibles:

  • statisctical analysis

  • visual nalysis

  • machine learning

  • semantic analysis

Explicación

Pregunta 144 de 200

1

machine learning

Selecciona una o más de las siguientes respuestas posibles:

  • classification

  • time series analysis

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 145 de 200

1

Two fundamental laws that pertain to machine learning

Selecciona una o más de las siguientes respuestas posibles:

  • law of large numbers

  • law commutative

  • Law of dimishing marginal utility

Explicación

Pregunta 146 de 200

1

the law _____________________________states that the confidence with wich predictions can be made increases as the size of data that is being analyzed increases

Selecciona una de las siguientes respuestas posibles:

  • law of large numbers

  • law of dimishing marginal utility

Explicación

Pregunta 147 de 200

1

in other words the accuracy and applicability of the patterns and relationshipsthat are found in a large dataset will be higher that of a smaller dataset

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 148 de 200

1

the greater the amount of data available for analysis, the better we become of making correct decisions

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 149 de 200

1

in the context of traditional data analysis, ___________________________ states that, starting with a reasonably large sample size, the value obtained from the analysis of additional data decreases as more data is successively added to the original sample

Selecciona una de las siguientes respuestas posibles:

  • the law of diminishing marginal utility

  • the law of large number

Explicación

Pregunta 150 de 200

1

The law of dimishing marginal utility does not apply to big data

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 151 de 200

1

The greater the volume and variety of data that Big Data solutions can process allows for each additional batch of data to carry greater potential of unearthing new patterns and anomalies. Therefore, the value of each additional batch does not diminish value: rather, it provides more value

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 152 de 200

1

is a supervised learning technique by witch data is classified into relevant, previously learned categories

Selecciona una de las siguientes respuestas posibles:

  • classification

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 153 de 200

1

Step 1: The system is fed data that is already categorized or labeled, so that it can develop an understanding of different categories

Selecciona una de las siguientes respuestas posibles:

  • clustering

  • classification

  • filtering

  • outlier detection

Explicación

Pregunta 154 de 200

1

step 2: The system is fed unknow (but similar) data for classification, based on the understanding it developed

Selecciona una de las siguientes respuestas posibles:

  • classification

  • filtering

  • outlier detection

  • clustering

Explicación

Pregunta 155 de 200

1

A common application of this techniques is for the filtering of e-mail spam. Note that classification can be performed for two or more categories

Selecciona una de las siguientes respuestas posibles:

  • filtering

  • clustering

  • classification

  • outlier detection

Explicación

Pregunta 156 de 200

1

Based on old data, a training dataset is compiled that contains tagged examples of customers that have or not previously defaulted

Selecciona una de las siguientes respuestas posibles:

  • clustering

  • filtering

  • classification

  • outlier detection

Explicación

Pregunta 157 de 200

1

Does a fingerprint belong to a suspect based on a record of this previous fingerprints

Selecciona una de las siguientes respuestas posibles:

  • outlier detection

  • clustering

  • classification

  • filtering

Explicación

Pregunta 158 de 200

1

Is an unsupervised learning technique by wich data is divided into different groups so that the data in each group has similar properties

Selecciona una de las siguientes respuestas posibles:

  • classification

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 159 de 200

1

There is no prior learning of categories required: instead categories are implicity generated based on the data groupings

Selecciona una de las siguientes respuestas posibles:

  • outlier detection

  • clustering

  • filtering

  • classification

Explicación

Pregunta 160 de 200

1

Is generally used in data minig to get an understanding of properties of a given dataset. Afterdeveloping this understanding, classificatioin can be used to make better predictions about similar, but new or unseen data

Selecciona una de las siguientes respuestas posibles:

  • classification

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 161 de 200

1

In a bank each group is the introduced to one or more financial products most suitable to the characteristics of the overall profile of the group

Selecciona una de las siguientes respuestas posibles:

  • clustering

  • filtering

  • outlier detection

  • classification

Explicación

Pregunta 162 de 200

1

How many different categories of elements are there in the periodic table

Selecciona una de las siguientes respuestas posibles:

  • classification

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 163 de 200

1

Detection is the process of finding data that is significantly different from or inconsistent with the rest of the data within a given dataset

Selecciona una de las siguientes respuestas posibles:

  • filtering

  • calssification

  • clustering

  • outlier detection

Explicación

Pregunta 164 de 200

1

this machine learning tecnique is used to identify anomalies, abnormalities and deviations that can be opportunities or risks

Selecciona una de las siguientes respuestas posibles:

  • outlier detection

  • classification

  • clustering

  • filtering

Explicación

Pregunta 165 de 200

1

it can be bsaed on either supervised or unsupervised learning

Selecciona una de las siguientes respuestas posibles:

  • clustering

  • outlier detection

  • classification

  • filtering

Explicación

Pregunta 166 de 200

1

include fraud detection, medical diagnosis, network data analysis and sensor data analysis

Selecciona una de las siguientes respuestas posibles:

  • filtering

  • outlier detection

  • classification

  • clustering

Explicación

Pregunta 167 de 200

1

In order ti find if a transaction is likely to be fraudulent or not, the bank´s IT team builds a sustem emplying ____________________ technique that is based on supervised learning

Selecciona una de las siguientes respuestas posibles:

  • classificaction

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 168 de 200

1

are there any wrongly identified fruits and vegetables in the training dataset used for classification task

Selecciona una de las siguientes respuestas posibles:

  • classification

  • outlier detection

  • clustering

  • filtering

Explicación

Pregunta 169 de 200

1

is the automated process of finding relevant items from a pool of items

Selecciona una de las siguientes respuestas posibles:

  • classification

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 170 de 200

1

items can be filtered either based on a users own behavior or by matching the behavior of multiple users

Selecciona una de las siguientes respuestas posibles:

  • classification

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 171 de 200

1

_________________ is generally applied viat the following two approaches

Selecciona una o más de las siguientes respuestas posibles:

  • collaborative filtering

  • user behavior

  • content-based filtering

Explicación

Pregunta 172 de 200

1

items can be filtered either based on a users own behavior or by matching the behavior of multiple users

Selecciona una de las siguientes respuestas posibles:

  • clustering

  • filtering

  • classification

  • outlier detection

Explicación

Pregunta 173 de 200

1

A common medium by wich ________________is implemented is via the use of a recomender system

Selecciona una de las siguientes respuestas posibles:

  • classification

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 174 de 200

1

technique based on the collaboration of users past behavior

Selecciona una de las siguientes respuestas posibles:

  • collaborative filtering

  • classification

  • clustering

  • outlier detection

  • content-based filtering

Explicación

Pregunta 175 de 200

1

based on the similarityof users behavior, items are filtered for the target user

Selecciona una de las siguientes respuestas posibles:

  • classification

  • clustering

  • outlier detection

  • filtering

Explicación

Pregunta 176 de 200

1

is solely based on the similarity between users behavior, and requires a large amount of user behavior data in order to accurately

Selecciona una de las siguientes respuestas posibles:

  • filtering

  • classification

  • clustering

  • outlier detection

  • filtering collaborative

Explicación

Pregunta 177 de 200

1

collaborative filtering is an example of application of law of large numbers

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 178 de 200

1

technique focused on the similarity between users an items

Selecciona una de las siguientes respuestas posibles:

  • classification

  • clustering

  • outlier detection

  • filtering

  • content-based filtering

Explicación

Pregunta 179 de 200

1

A user profile is created based on the users past behavior (likes, ratings, purchase history, etc)

Selecciona una de las siguientes respuestas posibles:

  • collaborative filtering

  • content_based filtering

Explicación

Pregunta 180 de 200

1

Contrary to collaborative filtering, content-based filtering is solely dedicated to individual user preferences and does not require data about other users

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 181 de 200

1

A recomender system predicts user preferences and generate suggestions for the user accordingly

Selecciona una de las siguientes respuestas posibles:

  • filtering

  • classification

  • clustering

  • outlier detection

Explicación

Pregunta 182 de 200

1

suggestions commonly pertain to recomending items, such as movies, books, web pages, people etc

Selecciona una de las siguientes respuestas posibles:

  • clustering

  • classification

  • filtering

  • outlier dtection

Explicación

Pregunta 183 de 200

1

A recomender system typically uses either collaborative filtering or content-based filtering to generate suggestions

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 184 de 200

1

recommender system may also be based on a hybrid of both collaborative filtering and content-based filtering to fine-tune the accuracy and effectiveness of generated suggestions

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 185 de 200

1

Based on matches found between financial product purchased by customers and the properties of similar financial products, the recommnder system automates seggestion for potential financial products that customers may also be interested in

Selecciona una de las siguientes respuestas posibles:

  • clustering

  • classification

  • filtering

  • outlier detection

Explicación

Pregunta 186 de 200

1

Wich holiday destinations can be recommended based on the travel history of a holiday makes?

Selecciona una de las siguientes respuestas posibles:

  • clustering

  • classification

  • outlier detetcion

  • filtering

Explicación

Pregunta 187 de 200

1

A fragment of text or speech data can carry different meanings in different contexts, whereas a complete sentence may retain its meaning, even if structured in different ways. In order for the machines to extract valuable information, text and speech data needs to be understood by the machines in the same way as humans do. Semantic analysis represents practices for extracting meaningful information from textual and speech data

Selecciona una de las siguientes respuestas posibles:

  • statistical analysis

  • semantic analysis

  • visual analysis

  • machinne learning

Explicación

Pregunta 188 de 200

1

types of semantic analysis

Selecciona una o más de las siguientes respuestas posibles:

  • natural language processing

  • human behavior language

  • text analytics

  • sentimental analysis

Explicación

Pregunta 189 de 200

1

Is a computers ability to comprehend human speech and text as naturally understood by humans

Selecciona una de las siguientes respuestas posibles:

  • text analytics

  • Natural language Processing

  • sentiment analysis

Explicación

Pregunta 190 de 200

1

This allows computers to perfom a variety of useful task, such as full-text searches

Selecciona una de las siguientes respuestas posibles:

  • Text analysis

  • sentiment analysis

  • Natural language processiing (NLP)

Explicación

Pregunta 191 de 200

1

instead of hard-coding the required learning rules, either supervised or unsupervised machine learning is applied to develop the computer undestanding of the natural language

Selecciona una de las siguientes respuestas posibles:

  • text analysis

  • natural language processing

  • sentiment analysis

Explicación

Pregunta 192 de 200

1

in general the more learning data the computer has, the more correctly it can decipher human text and speech

Selecciona una de las siguientes respuestas posibles:

  • natural language Processing

  • text analytics

  • sentiment analysis

Explicación

Pregunta 193 de 200

1

Natural language processing includes both text and speech recognition

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 194 de 200

1

For speech recognition the system attempts to comprehend the speech and then performs an action, such as transcribing text

Selecciona una de las siguientes respuestas posibles:

  • text analytics

  • sentiment analysis

  • Natural language processing

Explicación

Pregunta 195 de 200

1

How can grammatical mistakes be automaticalle identified?

Selecciona una de las siguientes respuestas posibles:

  • text analytics

  • Natural Language processing

  • sentiment analysis

Explicación

Pregunta 196 de 200

1

Unstructured text is generally much more difficult to analyze and search, compared to structured text

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 197 de 200

1

is the specialized analysis of text through the application of data mining, machine learning and natural language processing techniques to extract value out of unstructured text. Text analytics essentially provides the ability to discover text rather than just search it

Selecciona una de las siguientes respuestas posibles:

  • Natural language processing

  • text analytics

  • sentimente analysis

Explicación

Pregunta 198 de 200

1

useful insights from text-based data can be gained by helping business develop an understanding of the information that is contained within a large body of text

Selecciona uno de los siguientes:

  • VERDADERO
  • FALSO

Explicación

Pregunta 199 de 200

1

the basic tenet of text analytics is to turn unstructured text into data that can be searched and analyzed

Selecciona una de las siguientes respuestas posibles:

  • Natural language processing

  • text analytics

  • sentiment analysis

Explicación

Pregunta 200 de 200

1

As the amount of digitized documents, e-mail, social media posts and log files increases, businesses have an increasing need to leverage any value that can be extracted from these forms of semi-structured and unstructured data

Selecciona una de las siguientes respuestas posibles:

  • text analytics

  • natural language processing

  • sentiment analysis

Explicación