📄 initbalance.c

📁 Handles Hexahedral, Tetrahedral, Quadrilateral, and Triangle meshes. Lagrangian, Hierarchic, and Mon
💻 C
📖 第 1 页 / 共 2 页
字号:
12 下一页
/* * Copyright 1997, Regents of the University of Minnesota * * initbalance.c * * This file contains code that computes an initial partitioning * * Started 3/4/96 * George * * $Id: initbalance.c,v 1.2 2004/03/08 04:58:31 benkirk Exp $ */#include <parmetislib.h>/************************************************************************** This function is the entry point of the initial balancing algorithm.* This algorithm assembles the graph to all the processors and preceeds* with the balancing step.**************************************************************************/void Balance_Partition(CtrlType *ctrl, GraphType *graph, WorkSpaceType *wspace){  int i, j, mype, npes, nvtxs, nedges, ncon;  idxtype *vtxdist, *xadj, *adjncy, *adjwgt, *vwgt, *vsize;  idxtype *part, *lwhere, *home;  GraphType *agraph, cgraph;  CtrlType myctrl;  int lnparts, fpart, fpe, lnpes, ngroups, srnpes, srmype;   int twoparts=2, numflag = 0, wgtflag = 3, moptions[10], edgecut, max_cut;  int sr_pe, gd_pe, sr, gd, who_wins, *rcounts, *rdispls;  float my_cut, my_totalv, my_cost = -1.0, my_balance = -1.0, wsum;  float rating, max_rating, your_cost = -1.0, your_balance = -1.0;  float lbvec[MAXNCON], lbsum, min_lbsum, *mytpwgts, mytpwgts2[2], buffer[2];  MPI_Status status;  MPI_Comm ipcomm, srcomm;  struct {    float cost;    int rank;  } lpecost, gpecost;  IFSET(ctrl->dbglvl, DBG_TIME, starttimer(ctrl->InitPartTmr));  vtxdist = graph->vtxdist;  agraph = Moc_AssembleAdaptiveGraph(ctrl, graph, wspace);  nvtxs = cgraph.nvtxs = agraph->nvtxs;  nedges = cgraph.nedges = agraph->nedges;  ncon = cgraph.ncon = agraph->ncon;  xadj = cgraph.xadj = idxmalloc(nvtxs*(5+ncon)+1+nedges*2, "U_IP: xadj");  vwgt = cgraph.vwgt = xadj + nvtxs+1;  vsize = cgraph.vsize = xadj + nvtxs*(1+ncon)+1;  cgraph.where = agraph->where = part = xadj + nvtxs*(2+ncon)+1;  lwhere = xadj + nvtxs*(3+ncon)+1;  home = xadj + nvtxs*(4+ncon)+1;  adjncy = cgraph.adjncy = xadj + nvtxs*(5+ncon)+1;  adjwgt = cgraph.adjwgt = xadj + nvtxs*(5+ncon)+1 + nedges;  /* ADD: this assumes that tpwgts for all constraints is the same */  /* ADD: this is necessary because serial metis does not support the general case */  mytpwgts = fsmalloc(ctrl->nparts, 0.0, "mytpwgts");  for (i=0; i<ctrl->nparts; i++)    for (j=0; j<ncon; j++)      mytpwgts[i] += ctrl->tpwgts[i*ncon+j];  for (i=0; i<ctrl->nparts; i++)    mytpwgts[i] /= (float)ncon;  idxcopy(nvtxs+1, agraph->xadj, xadj);  idxcopy(nvtxs*ncon, agraph->vwgt, vwgt);  idxcopy(nvtxs, agraph->vsize, vsize);  idxcopy(nedges, agraph->adjncy, adjncy);  idxcopy(nedges, agraph->adjwgt, adjwgt);  /****************************************/  /****************************************/  if (ctrl->ps_relation == DISCOUPLED) {    rcounts = imalloc(ctrl->npes, "rcounts");    rdispls = imalloc(ctrl->npes+1, "rdispls");    for (i=0; i<ctrl->npes; i++) {      rdispls[i] = rcounts[i] = vtxdist[i+1]-vtxdist[i];    }    MAKECSR(i, ctrl->npes, rdispls);    MPI_Allgatherv((void *)graph->home, graph->nvtxs, IDX_DATATYPE,    (void *)part, rcounts, rdispls, IDX_DATATYPE, ctrl->comm);    for (i=0; i<agraph->nvtxs; i++)      home[i] = part[i];    GKfree((void **)&rcounts, (void **)&rdispls, LTERM);  }  else {    for (i=0; i<ctrl->npes; i++)      for (j=vtxdist[i]; j<vtxdist[i+1]; j++)        part[j] = home[j] = i;  }  /* Ensure that the initial partitioning is legal */  for (i=0; i<agraph->nvtxs; i++) {    if (part[i] >= ctrl->nparts)      part[i] = home[i] = part[i] % ctrl->nparts;    if (part[i] < 0)      part[i] = home[i] = (-1*part[i]) % ctrl->nparts;  }  /****************************************/  /****************************************/  IFSET(ctrl->dbglvl, DBG_REFINEINFO, Moc_ComputeSerialBalance(ctrl, agraph, agraph->where, lbvec));  IFSET(ctrl->dbglvl, DBG_REFINEINFO, rprintf(ctrl, "input cut: %d, balance: ", ComputeSerialEdgeCut(agraph)));  for (i=0; i<agraph->ncon; i++)    IFSET(ctrl->dbglvl, DBG_REFINEINFO, rprintf(ctrl, "%.3f ", lbvec[i]));  IFSET(ctrl->dbglvl, DBG_REFINEINFO, rprintf(ctrl, "\n"));  /****************************************/  /* Split the processors into two groups */  /****************************************/  sr = (ctrl->mype % 2 == 0) ? 1 : 0;  gd = (ctrl->mype % 2 == 1) ? 1 : 0;  if (graph->ncon > MAX_NCON_FOR_DIFFUSION || ctrl->npes == 1) {    sr = 1;    gd = 0;  }  sr_pe = 0;  gd_pe = 1;  MPI_Comm_split(ctrl->gcomm, sr, 0, &ipcomm);  MPI_Comm_rank(ipcomm, &mype);  MPI_Comm_size(ipcomm, &npes);  myctrl.dbglvl = 0;  myctrl.mype = mype;  myctrl.npes = npes;  myctrl.comm = ipcomm;  myctrl.sync = ctrl->sync;  myctrl.seed = ctrl->seed;  myctrl.nparts = ctrl->nparts;  myctrl.ipc_factor = ctrl->ipc_factor;  myctrl.redist_factor = ctrl->redist_base;  myctrl.partType = ADAPTIVE_PARTITION;  myctrl.ps_relation = DISCOUPLED;  myctrl.tpwgts = ctrl->tpwgts;  icopy(ncon, ctrl->tvwgts, myctrl.tvwgts);  icopy(ncon, ctrl->ubvec, myctrl.ubvec);  if (sr == 1) {    /*******************************************/    /* Half of the processors do scratch-remap */    /*******************************************/    ngroups = amax(amin(RIP_SPLIT_FACTOR, npes), 1);    MPI_Comm_split(ipcomm, mype % ngroups, 0, &srcomm);    MPI_Comm_rank(srcomm, &srmype);    MPI_Comm_size(srcomm, &srnpes);    moptions[0] = 0;    moptions[7] = ctrl->sync + (mype % ngroups) + 1;    idxset(nvtxs, 0, lwhere);    lnparts = ctrl->nparts;    fpart = fpe = 0;    lnpes = srnpes;    while (lnpes > 1 && lnparts > 1) {      ASSERT(ctrl, agraph->nvtxs > 1);      /* Determine the weights of the partitions */      mytpwgts2[0] = ssum(lnparts/2, mytpwgts+fpart);      mytpwgts2[1] = 1.0-mytpwgts2[0];      if (agraph->ncon == 1) {        METIS_WPartGraphKway2(&agraph->nvtxs, agraph->xadj, agraph->adjncy, agraph->vwgt, 	      agraph->adjwgt, &wgtflag, &numflag, &twoparts, mytpwgts2, moptions, &edgecut, 	      part);      }      else {        METIS_mCPartGraphRecursive2(&agraph->nvtxs, &ncon, agraph->xadj, agraph->adjncy, 	      agraph->vwgt, agraph->adjwgt, &wgtflag, &numflag, &twoparts, mytpwgts2, 	      moptions, &edgecut, part);      }      wsum = ssum(lnparts/2, mytpwgts+fpart);      sscale(lnparts/2, 1.0/wsum, mytpwgts+fpart);      sscale(lnparts-lnparts/2, 1.0/(1.0-wsum), mytpwgts+fpart+lnparts/2);      /* I'm picking the left branch */      if (srmype < fpe+lnpes/2) {        Moc_KeepPart(agraph, wspace, part, 0);        lnpes = lnpes/2;        lnparts = lnparts/2;      }      else {        Moc_KeepPart(agraph, wspace, part, 1);        fpart = fpart + lnparts/2;        fpe = fpe + lnpes/2;        lnpes = lnpes - lnpes/2;        lnparts = lnparts - lnparts/2;      }    }    /* In case srnpes is greater than or equal to nparts */    if (lnparts == 1) {      /* Only the first process will assign labels (for the reduction to work) */      if (srmype == fpe) {        for (i=0; i<agraph->nvtxs; i++)           lwhere[agraph->label[i]] = fpart;      }    }    /* In case srnpes is smaller than nparts */    else {      if (ncon == 1)        METIS_WPartGraphKway2(&agraph->nvtxs, agraph->xadj, agraph->adjncy, agraph->vwgt, 	      agraph->adjwgt, &wgtflag, &numflag, &lnparts, mytpwgts+fpart, moptions, 	      &edgecut, part);      else        METIS_mCPartGraphRecursive2(&agraph->nvtxs, &ncon, agraph->xadj, agraph->adjncy, 	      agraph->vwgt, agraph->adjwgt, &wgtflag, &numflag, &lnparts, mytpwgts+fpart, 	      moptions, &edgecut, part);      for (i=0; i<agraph->nvtxs; i++)         lwhere[agraph->label[i]] = fpart + part[i];    }    MPI_Allreduce((void *)lwhere, (void *)part, nvtxs, IDX_DATATYPE, MPI_SUM, srcomm);    edgecut = ComputeSerialEdgeCut(&cgraph);    Moc_ComputeSerialBalance(ctrl, &cgraph, part, lbvec);    lbsum = ssum(ncon, lbvec);    MPI_Allreduce((void *)&edgecut, (void *)&max_cut, 1, MPI_INT, MPI_MAX, ipcomm);    MPI_Allreduce((void *)&lbsum, (void *)&min_lbsum, 1, MPI_FLOAT, MPI_MIN, ipcomm);    lpecost.rank = ctrl->mype;    lpecost.cost = lbsum;    if (min_lbsum < UNBALANCE_FRACTION * (float)(ncon)) {      if (lbsum < UNBALANCE_FRACTION * (float)(ncon))        lpecost.cost = (float)edgecut;      else        lpecost.cost = (float)max_cut + lbsum;    }    MPI_Allreduce((void *)&lpecost, (void *)&gpecost, 1, MPI_FLOAT_INT, MPI_MINLOC, ipcomm);    if (ctrl->mype == gpecost.rank && ctrl->mype != sr_pe) {      MPI_Send((void *)part, nvtxs, IDX_DATATYPE, sr_pe, 1, ctrl->comm);    }    if (ctrl->mype != gpecost.rank && ctrl->mype == sr_pe) {      MPI_Recv((void *)part, nvtxs, IDX_DATATYPE, gpecost.rank, 1, ctrl->comm, &status);    }    if (ctrl->mype == sr_pe) {      idxcopy(nvtxs, part, lwhere);
12 下一页
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -