Datacenter – Banco De Dados

Sistemas de Banco de Dados

O que é um banco de dados e qual a sua importância?

A maioria de nós está familiarizada com algum tipo de sistema de manutenção de registros. Algumas pessoas armazenam todos os seus recibos como preparação para o pagamento de impostos. Outros que gerem uma empresa podem manter o controle de suas vendas e despesas para se certificar de que estão atingindo suas metas. Médicos mantem os arquivos de todos os seus pacientes, e assim por diante.

Um sistema de banco de dados não é nada mais do que um armário de arquivamento eletrônico e os “pedidos” são interações com o armário para adicionar, remover, atualizar ou recuperar um arquivo.

Que tipo de dados que você pode coletar?

Normalmente, você deseja salvar os dados que vai ser de algum valor para você no futuro. Isso é chamado de dados persistentesporque ele é salvo por um tempo maior do que o comprimento da sessão do usuário ou de um dia inteiro de atividade.

Devido ao “poder dos dados e da análise” em gerar eficiência, insights e oportunidades, a importância das bases de dados é fundamental para todas as empresas de hoje.

Este é uma questão a ser prospectada tanto na perspectiva de vendas quanto na perspectiva técnica.

Quais os quatro componentes do Banco de Dados?

Bases de dados consistem em quatro componentes: dados, hardware, software e usuários.

Dados

Dados é a condição sine qua non de um banco de dados – sendo a informação real que você deseja salvar no banco de dados. Além dos dados, você também guarda informações sobre os dados e banco de dados. Você salva este “metadados”em um lugar chamado o “catalogo ” -para o caso de você precisar refrescar sua memória sobre o que você está coletando e como está sendo armazenado.

Metadados, são dados sobre outros dados. Um item de um metadado pode dizer do que se trata aquele dado, geralmente uma informação inteligível por um computador. Os metadados facilitam o entendimento dos relacionamentos e a utilidade das informações dos dados.

Equipamento (hardware)

Os dados são fisicamente armazenados em algum componente de hardware que tipicamente em armazenamento secundário, tais como discos magnéticos. O hardware de armazenamento pode ser classificados de diversas formas: primária, secundária e terciária.

Programas

Quando os usuários interagem com um site por exemplo, eles vão executar determinadas ações que devem ser salvas no banco de banco de dados. Um sistema de gerenciamento de banco de dados (DMBS) constitui a camada de software de interface entre os usuários e o banco de dados real.

Usuários

Os usuários finais são os usuários que interagem com uma aplicação, geram solicitações para o banco de dados em segundo plano. Quando um novo usuário se registra, por exemplo, uma solicitação de banco de dados é emitida solicitando ao SGBD adicionar um novo usuário ao banco de dados.

Qual a função do sistema de gerenciamento de banco de dados num sistema de informação?

Num banco de dados o SGBD – Sistema de Gerenciamento de Banco de Dados – é responsável pela definição do banco de dados, armazenamento, manipulação, e compartilhamento dos dados entre usuários e aplicações.

Pense o SGBD como o chefe da gestão de arquivo, responsável por gerenciar os pedidos de acesso ao banco de dados. Quando um usuário clica em “aceitar amigo” no Facebook, um pedido é criado e dirigido para o banco de dados. O SGBD deve aceitar e analisar todos os pedidos antes de enviar a solicitação ao longo do seu caminho para o banco de dados, em que ponto ele é interpretado e executado. O código que realmente acessa a base de dados é chamado um sublinguagem dados; uma versão popular é SQL (Structured Query Languag) O SGBD fornece uma maneira de controlar a simultaneidade (várias solicitações ao banco de dados acontecendo ao mesmo tempo), redundância (o mesmo pedaço de informação armazenada várias vezes no banco de dados), a segurançaa recuperação (proteção contra algum tipo de falha de banco de dados) e otimização – aspectos que melhorar muito o valor para o desenvolvedor.


 

Big data

Como o big data difere dos dados normais?

Big Data tem como principal objetivo a tomada de decisão em tempo real baseada em análise de dados. É direcionado para o tratamento de grandes volumes de informação, com grande variedade de dispositivos e velocidades de informação.

A quantidade de informações que temos hoje é muito maior e não é capaz de ser processada pelos métodos tradicionais. Bancos de dados relacionais são demasiado caros e restritivos para tratar essa nova demanda. Os modelos não-relacionais mais escaláveis e flexíveis estão vindo à tona.

Existem alguns termos usados para descrever dados.

  • O primeiro é o volume, que é uma característica óbvia do nome big data. A quantidade de informação é o maior problema e levou os engenheiros a investir em sistemas distribuídos como a solução.
  • Em seguida, é a velocidade, que se refere à taxa em que os novos dados são criados. A velocidade de dados do Facebook é muito superior do que de um site de uma empresa tradicional. Com tantas interações no Facebook todos os dias, o Facebook precisa fazer uma importante decisão: o que manter e o que jogar fora? Sites de compras online enfrentam um dilema semelhante. Cada vez que um usuário clica em um item ou escreve um termo de pesquisa, a empresa deve decidir se deseja salvar essa informação. No entanto, quanto maior o volume para salvar, maior velocidade é necessária para converter dados em insights. Se os varejistas são lentos para personalizar a experiência da web para seus clientes devido a um atraso no processamento de dados, os concorrentes mais rápidos são susceptíveis de ganhar.
  • Por último, existe variedade. Se os dados provêm de várias fontes e em várias formas, apresenta um conjunto de questões a resolver muito mais complicado.

Veja algumas estatísticas dos desafios da comunicação em larga escala:

Volume de Informação …

  • 10 aparelhos conectados por casa para 2020
  • 5 aparelhos conectados por usuário para 2020
  • 5 bilhões de usuários da internet em 2020

Variedade de dispositivos e formas …

  • Smartphones e tablets
  • M2M
  • RFID
  • NFC
  • Aparelhos inteligentes 4G
  • Vídeo chamada e vídeo em tempo real
  • Wi-Fi

Velocidade para o tratamento de altos volumes de informação …

  • Análise em tempo real
  • Estratégia Preventiva
  • Aproveitar novas oportunidades

Por ter essas características, quaisquer projetos envolvendo big data mexem com o núcleo de informação e decisão da empresa, têm alta conexão com serviços e projetos de datacenter, cloud computing, redes IP VPN, mobilidade e unified  communication.


Big data e Handoop

Vamos supor que você tenha um grande volume de dados de variedade significativa. As chances de você poder gerar informação ou insights são poucas ou nenhuma, especialmente se não for identificado um padrão óbvio.

Uma palavra importante em big data é Hadoop, uma plataforma de software que permite às organizações executarem testes em seus dados com a esperança de responder perguntas.

A arquitetura distribuída é a chave por trás da capacidade de armazenar e processar grandes quantidades de informação.

Hadoop permite que as organizações gerem um sentido aos seus dados espalhando-os ao longo de um grupo de poderosos processadores que funcionam em paralelo para estudar as informações.

O método geral Hadoop usa o chamado Mapear Reduzir (MapReduce), que consiste em duas partes: mapear e reduzir.

  •  Suponha que você tem alguma pergunta que você deseja determinar a partir de seu conjunto de dados e seus projetistas escrevem uma função que teoricamente vai dar a resposta certa.
  • A função Map vai separar a tarefa em várias partes e distribuí-la através de várias máquinas.
  • Quando esta fase estiver completa, a função reduzir irá combinar os resultados em uma única tarefa para concluir a análise.
  • Nenhuma máquina única é capaz de fazer uma grande quantidade de trabalho em tempo hábil, de modo que a estratégia de dividir e conquistar do Hadoop é uma ferramenta muito poderosa.